Banco Interamericano de Desarrollo
facebook
twitter
youtube
linkedin
instagram
Abierto al PúblicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoIndustrias CreativasLa Maleta AbiertaMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente¿Y si hablamos de igualdad?Inicio
Administración pública Agua y saneamiento Ciencia, tecnología e innovación Comercio e integración regional Conocimeinto Abierto Desarrollo infantil temprano Desarrollo urbano y vivienda Educación Energía Género y diversidad Impacto Industrias Creativas Medio ambiente, cambio climático y Salvaguardias Política y gestión fiscal Salud Sin Miedos Trabajo y pensiones
  • Skip to main content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Abierto al Público

  • INICIO
    • ¿Qué es el Conocimiento Abierto?
    • Sobre este blog
    • ¿Cómo suscribirse?
    • Pautas editoriales
  • CATEGORÍAS
    • Aprendizaje abierto
    • Código abierto
    • Datos abiertos
    • Gestión del conocimiento
    • Sistemas abiertos
  • AUTORES
  • Español

Tratemos las bases de datos como si fueran artículos científicos

October 21, 2014 by Antonio Moneo 4 Comentarios


En las últimas semanas, varios expertos en datos abiertos han coincidido en señalar que la baja calidad de muchos datos que se publican en los  portales de datos está afectando negativamente a los esfuerzos por fomentar los datos abiertos. Los problemas de calidad de los datos más frecuentes son la inconsistencia de las series temporales (en ocasiones faltan datos de algún año), una codificación inconsistente (que hace compleja la explotación de los datos), y la inclusión de muchas bases de datos con pocas líneas de información.

Abrir datos (Open Data) no es solo hacer públicos los datos, puesto que en su gran mayoría los datos ya están publicados de varias formas en las páginas web de los Institutos Nacionales de Estadística y otras páginas web oficiales. El gran desafío consiste en publicar datos sistematizados que sean accesibles también para las aplicaciones informáticas que reutilicen la información y permitan generar nuevos usos para esa información. Si la información no es de calidad y no se puede usar, todo este esfuerzo habrá sido en vano.

Organismos certifican la calidad de las bases de datos

Para solucionar esta cuestión, ya hay varias organizaciones que trabajan por certificar la calidad de las bases de datos. El Open Data Institute (Reino Unido), una organización dirigida por Tim Berners-Lee y Nigel Shadbolt, que está poniendo muchos esfuerzos por fomentar unos datos de mejor calidad. En Alemania, el Franuhofer Fokus que promueve el avance de los datos abiertos, también tiene un área de trabajo importante en lo que se refiere a la limpieza y  estandarización de los datos abiertos.

Hay herramientas que permiten verificar la consistencia de las bases de datos

Por otro lado, comienzan a surgir varias aplicaciones web que permiten verificar la calidad de las bases de datos antes de subirlas al portal de datos abiertos. Open Source Data Quality and Profiling es una aplicación libre que permite analizar la calidad de nuestras bases de datos mediante varios procesos. Talend ofrece una versión gratuita y otra de pago, y Data Cleaner ofrece un servicio de pago para limpiar y estandarizar bases de datos. Uno de los más utilizados por los expertos es Open Refine, que originalmente fue desarrollado por Google.

Desarrollar marcos regulatorios puede ayudar a garantizar la consistencia a distintos niveles

En algunos países, los estándares para las bases de datos están definidos en las legislaciones nacionales o supranacionales, como ocurre en los países europeos. Definir un estándar de publicación de datos que tenga un rango jerárquico es importante para que luego puedan integrarse las bases de datos y generar un universo de datos abiertos pero esto no siempre evita que se publiquen bases de datos que contengan poca información o escasamente relevante.

Los expertos del ODI señalan que muchos de los errores que se producen no tienen que ver tanto con los marcos regulatorios, sino con las decisiones de los administradores de los portales de datos abiertos, y por lo tanto el problema es, una vez más, cultural y no tecnológico.

Por eso conviene realizar una analogía entre el proceso de publicación de bases de datos y de artículos científicos. Quizás sería conveniente pensar en un proceso de revisión por pares u otro tipo de metodologías, como la valoración de los usuarios, para certificar la calidad y pertinencia de los datos. Estas herramientas no suponen un gran desafío tecnológico y ya han demostrado su utilidad para moderar, por ejemplo, los comentarios en los artículos de periódico y blogs, o para valorar la calidad de los productos y vendedores en tiendas online como Amazon o Ebay.

Aun así, en el caso de que la solución tecnológica no fuera posible o fuera demasiado costosa, deberían existir otros mecanismos de control de calidad como ocurre en la literatura científica. Certificar la calidad y la pertinencia de las bases de datos, usando la opinión de los usuarios o de los expertos es importante si queremos que los datos abiertos produzcan el impacto que esperamos. Si vamos a basar nuestras decisiones en estos datos, es mejor que sean fiables.


Archivado Bajo:Datos abiertos Etiquetado con:Análisis de datos, Recursos accionables

Antonio Moneo

Antonio es especialista en Gestión de Conocimiento. Trabajó en el Banco Interamericano de Desarrollo promoviendo los datos abiertos como una herramienta para la resolución de retos del desarrollo y en la London School of Economics como gestor de programas académicos y de investigación. Es miembro de la Carta Internacional de Datos Abiertos y formador registrado en el Open Data Institute (ODI). Cuenta con un doctorado en Ciencia Política y una Maestría en Comercio Internacional.

Reader Interactions

Comments

  1. Diego Dice

    October 22, 2014 at 3:42 pm

    Es un buena idea tratar los conjuntos de datos como publicaciones científicas pero pienso que una alternativa viable es mejorar y complementar la metadata asociada a los conjuntos de datos que se publican, con esta información de antemano se optimiza el análisis. Por ejemplo, que los comentarios de los usuarios de esos datos se agreguen a la metadata y en forma colaborativa que permita votar para subir o bajar un comentario o indicación acerca de los datos (así como en stackoverflow) permite generar en el tiempo metadata y conocimiento respecto a los datos, enriqueciendo el conjunto de datos en a medida que es utilizado.

    Reply
    • Open Knowledge (admin) Dice

      October 22, 2014 at 6:58 pm

      Muchas gracias Diego. Muy interesante tu propuesta. Estoy totalmente de acuerdo y, de hecho, esto es algo que he visto ya en algún portal de datos abiertos, como el de México (datos.gob.mx). De esa experiencia también me parece relevante añadir que es importante que los comentarios estén moderados y sean constructivos. Muchos portales como datos.gob.mx están empezando a incluir el plugin de Disqus (https://disqus.com/), que ayuda a generar discusiones más constructivas. Pero lo más relevante en el caso de datos.gob.mx es que los administradores del portal responden a los comentarios.

      Otra herramienta que me parece muy útil es la que utiliza el Gobierno de Colonia (Alemania). Ellos permiten a los usuarios dar un “rating” a cada conjunto de datos (de 1 a 5 estrellas). Esto me parece otro mecanismo interesante para evaluar la calidad de las bases de datos publicadas. Está todo en alemán, pero échale un vistazo a esto: http://www.offenedaten-koeln.de/dataset/vornamen

      ¡Saludos y gracias por el comentario!

      Reply
  2. Nelson Dice

    November 10, 2014 at 1:12 pm

    Hola
    Hay algún sistema en línea, gratuito y seguro para que una institución pública lleve sus bases de datos?

    Reply
    • Open Knowledge (admin) Dice

      November 10, 2014 at 2:01 pm

      Hola Nelson,

      Sí. Hay varios. CKAN es el más conocido. Es una aplicación en python que utilizan los gobiernos de UK, USA y México por ejemplo. DKAN está programado en Drupal, también es Open Source y ha sido utilizado ya por varias organizaciones en el mundo. Junar es una plataforma online que pronto lanzará una versión Open Source. CKAN es una solución que puede integrarse en WordPress u otro CMS para mejorar la manera en que se muestran los resultados, y DKAN ofrece un “todo en uno”, que puede personalizarse con bastante facilidad.

      La Presidencia de México, el Gobierno de EEUU y otros han subido el código ya desarrollado en Github y, por lo tanto, sería posible replicar lo que ellos han hecho. Te recomiendo que busques el código de datos.gob.mx o data.gov, ambas soluciones son CKAN + WordPress

      Saludos,
      Antonio

      Reply

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Primary Sidebar

SIGUENOS

Suscríbete

Sobre este blog

Podemos describir al conocimiento abierto como aquel conocimiento que puede ser usado, reutilizado y compartido sin restricciones, ya que cuenta con las características tanto legales como tecnológicas para ser accedido por cualquier persona, en cualquier momento y en cualquier lugar del mundo.

En el blog "Abierto al Público" exploramos los temas, recursos, iniciativas e impacto de la apertura de conocimiento a nivel global, prestando especial atención a lo que sucede en la región de América Latina y el Caribe. También abordamos los esfuerzos que lleva a cabo el Banco Interamericano de Desarrollo por apoyar la diseminación del conocimiento abierto y accionable que constantemente genera esta organización.

Buscar

Explorar temas

AcademiaBID Acceso abierto Acceso a la información Análisis de datos Análisis de texto Big Data Cambio climático Ciencia Abierta Conceptos clave Conocimiento Abierto Coronavirus Creative Commons Credenciales digitales Crowdsourcing Código para el Desarrollo Datos geoespaciales Diseño instruccional El Rincón de Publicación Emprendimiento Eventos Gobierno abierto Género y diversidad Hackatones Inclusión digital Innovación abierta Inteligencia Artificial Lecciones aprendidas Metodologías MOOC Más leídos Números para el Desarrollo Objetivos de Desarrollo Sostenible Participación ciudadana Paso a paso Periodismo de datos Procesamiento del Lenguaje Natural Productos de conocimiento Protección de datos Proyectos de desarrollo Recursos accionables Solidaridad Trabajo en equipo Visualización de datos

Publicaciones similares

  • 5 nuevos perfiles para la industria de los datos
  • 5 ganadores de los premios de datos abiertos
  • 4 cosas que puedes hacer con tus bases de datos
  • 6 pasos para encontrar y explorar datos abiertos de forma gratuita
  • 8 herramientas para visualizar datos

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube
youtube

Blogs escritos por empleados del BID:

Copyright © Banco Interamericano de Desarrollo ("BID"). Este trabajo está disponible bajo los términos de una licencia Creative Commons IGO 3.0 Reconocimiento-No comercial-Sin Obras Derivadas. (CC-IGO 3.0 BY-NC-ND) y pueden reproducirse con la debida atribución al BID y para cualquier uso no comercial. No se permite ningún trabajo derivado. Cualquier disputa relacionada con el uso de las obras del BID que no se pueda resolver de manera amistosa se someterá a arbitraje de conformidad con el reglamento de la CNUDMI. El uso del nombre del BID para cualquier otro propósito que no sea la atribución, y el uso del logotipo del BID estarán sujetos a un acuerdo de licencia escrito por separado entre el BID y el usuario y no está autorizado como parte de esta licencia CC-IGO. Tenga en cuenta que el enlace proporcionado anteriormente incluye términos y condiciones adicionales de la licencia.


Blogs escritos por autores externos:

Para preguntas relacionadas con los derechos de autor para autores que no son empleados del BID, por favor complete el formulario de contacto de este blog.

Las opiniones expresadas en este blog son las de los autores y no necesariamente reflejan las opiniones del BID, su Directorio Ejecutivo o los países que representan.

Atribución: además de otorgar la atribución al respectivo autor y propietario de los derechos de autor, según proceda, le agradeceríamos que incluyera un enlace que remita al sitio web de los blogs del BID.



Política de privacidad

Copyright © 2023 · Magazine Pro on Genesis Framework · WordPress · Log in

Banco Interamericano de Desarrollo

Aviso Legal

Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

facebook
twitter
youtube
En este sitio web se utilizan cookies para optimizar la funcionalidad y brindar la mejor experiencia posible. Si continúa visitando otras páginas, se instalarán cookies en su navegador.
Para obtener más información al respecto, haga clic aquí.
x
Manage consent

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Always Enabled

Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.

Non-necessary

Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.

SAVE & ACCEPT