La apertura de datos no es un momento sino un proceso, donde la publicación es solamente el primer horizonte en la transformación de los datos abiertos en un bien público valioso.
Para entender cuáles acciones avanzan este proceso, podemos referirnos al esquema de “Datos de Cinco Estrellas”. Este fue creado por Tim Berners-Lee, el conocido científico de la computación quien inició el concepto de los “datos vinculados” para poder medir la madurez técnica de los datos abiertos.
Aunque este esquema no sea nuevo, sigue siendo de utilidad para realizar una auto evaluación y estimar qué tan fácil es para otros encontrar, acceder y reutilizar los datos que abrimos. Es así que el público incluso puede lograr de alimentar a otras tecnologías con los mismos datos cuando alcancen la quinta estrella. En este post, miraremos las acciones concretas relacionadas con los estándares por cada estrella. Mientras más estrellas tengan tus datos, más será su facilidad de generar un impacto.
1 Una estrella: publicado bajo licencia abierta
En el nivel de entrada, lo más importante es demostrar la política de apertura. Si los datos publicados son publicados en línea y acompañados con una licencia abierta, ya cuentan con una estrella. Esto significa que el público que encuentre los datos tendrá el beneficio de acceder libremente a la información, pero aún hay más estrellas en el cielo.
Antes de ascender a otra estrella, siempre es requerido asignar una licencia abierta. Para encontrar la correcta para tus datos, puedes seguir los consejos de Open Data License (disponible en inglés), la guía de publicadores de Datos Abiertos del ODI (disponible en inglés), o las Licencias Creative Commons (CCL).
2 Dos estrellas: licencia abierta y datos estructurados
Los datos estructurados se encuentran en un formato que comienza a ser legible por máquinas, como una hoja de cálculo. Este paso agrega mucho valor al momento que un usuario quiere reutilizar los datos publicados y hacer su propio análisis. Sin embargo, ciertos formatos estructurados como el MS Excel son propietarios, y requieren que el usuario final tenga un software específico para acceder el contenido.
A este nivel es relativamente fácil hacer algunos ajustes para no quedarse sólo con dos estrellas, sino alcanzar la tercera.
3 Tres estrellas: abierto, estructurado, y no propietario
A la hora de publicar los datos en un formato estructurado, elige un formato como el CSV que es reconocido por una multitud de herramientas digitales en varios idiomas de programación. Es desde este nivel que los datos abiertos empiezan a consolidar su potencial para que su reutilización sea fácil, productiva, y genere impacto.
Puedes revisar el glosario de formatos en el Open Data Handbook para aprender sobre las opciones adecuadas.
4 Cuatro estrellas: todo lo anterior, y vinculado
Lo importante de este nivel es preparar los datos para que puedan integrarse con otras fuentes de datos y aplicaciones. Pasamos de conversar solamente de datos abiertos a datos vinculados. Los datos vinculados se pueden identificar y encontrar en la red gracias a la asignación de un “identificador uniforme de recursos” o “URI” por sus siglas en inglés. Un URL es un ejemplo de URI, que muchos ya reconocemos como la “dirección” de un sitio en la red.
Al tener su propia dirección, los datos ya no viven a través del sitio que originalmente los publicó, sino que pasan a ser una fuente en sí, que les permite integrarse libremente con otras fuentes de datos y aplicaciones, dándoles la posibilidad de ser reutilizados un sinfín de veces para distintas necesidades con una conexión directa.
Ahora bien, hay cuatros pasos para establecer un URI según las buenas prácticas. Lo importante es siempre crear estos URIs según los estándares abiertos de W3C: RDF y SPARQL. Este tutorial en español ayuda a comenzar con RDF.
El nivel de cuatro estrellas requiere un conocimiento técnico más detallado que los pasos anteriores, pero su relevancia está en facilitar la llegada al nivel cinco estrellas.
5 Cinco Estrellas: Todo lo anterior, vinculado con otros datos abiertos
La clave para que los datos abiertos lleguen a tener cinco estrellas es que sean vinculados con otros datos. Al integrar los datos con otra información relevante, la fusión de estas dos o más fuentes de información pone todo este conocimiento en un nuevo contexto, creando valor adicional.
Un ejemplo de datos vinculados es el Agregador de Indicadores de Números para el Desarrollo, una herramienta que permite analizar datos de múltiples fuentes como el BID y el Banco Mundial, con la capacidad de investigar las preguntas macroeconómicas en combinación con una perspectiva de género, gracias a la integración de los datos de No Ceilings. Esto se logra gracias a la manera en que todos los datos están vinculados, permitiendo ser extraídos y comparables en un sólo lugar. Otro ejemplo de los datos vinculados en acción se ve en los proyectos para monitorear las enfermedades de mosquitos, que incorporan múltiples variables de otras fuentes abiertas en tiempo real, como la temperatura ambiental y actividad en los medios sociales, para determinar el nivel de riesgo de un brote.
Es importante notar que este no es el único esquema para calificar los datos abiertos. Por ejemplo, el Instituto de Datos Abiertos (ODI por sus siglas en inglés) también tiene un sistema de medallas con criterios parecidos, pero dividido en cuatro niveles. Y aunque alcances las cinco estrellas, no significa que los datos sean de calidad perfecta o que no se puedan mejorar. El sistema Cinco Estrellas no evalúa la calidad del contenido de los datos en sí. Para esto, debemos seguir otras buenas prácticas relacionadas a la limpieza y verificación de datos. Digamos que las Cinco Estrellas nos ofrecen una base para guiarnos a construir información más compartible y encontrable en el universo masivo de la web.
Ahora, cuéntanos, ¿cuántas estrellas ganarían tus datos?
Por Michelle Marshall del Sector de Conocimiento y Aprendizaje del Banco Interamericano de Desarrollo
federico AMERIO Dice
Opinión sobre el artículo sobre datos abiertos
Estoy de acuerdo con el autor en que los datos abiertos son un bien público valioso que puede tener un impacto positivo en la sociedad. El esquema de “Datos de Cinco Estrellas” es una herramienta útil para medir la madurez técnica de los datos abiertos y evaluar su potencial para ser reutilizados.
Las acciones concretas relacionadas con los estándares que se mencionan en el artículo son importantes para que los datos abiertos sean más fáciles de encontrar, acceder y reutilizar. Por ejemplo, la publicación de los datos bajo una licencia abierta permite que cualquier persona pueda usarlos libremente, y la estructura de los datos en un formato legible por máquinas facilita su análisis.
Además de las acciones mencionadas en el artículo, también es importante que los datos abiertos estén bien documentados. Esto ayudará a que los usuarios puedan comprender la estructura de los datos y cómo utilizarlos.
En general, creo que el esquema de “Datos de Cinco Estrellas” es una herramienta valiosa para que las organizaciones que publican datos abiertos puedan mejorar la calidad de sus datos y aumentar su potencial para ser reutilizados.