Las plataformas de datos abiertos tienen características distintas entre sí. Quisiera compartir con ustedes tres plataformas que ayudan en el procesamiento y análisis de datos, cada una con objetivos diferentes y asociadas a una fase particular de la gestión de datos– una para curar y compartir datos; otra para procesar y compartir información y otra para compartir recomendaciones accionables con base en el análisis de datos. Esperamos que estos ejemplos te ayuden a familiarizarte con las fases de gestión de datos y te inspiren a aprovechar las distintas plataformas según sus aportes.
Fase 1: Generación de datos
La generación de datos es un proceso arduo y tedioso que no se debe menospreciar ya que el resultado final del producto que se quiere obtener depende de la calidad y el origen del dato.
Por ejemplo, los datos que hacen referencia a un espacio temporal pueden ayudar a entender de una manera más global la situación de un problema. Este es el objetivo del Observatorio de Seguridad Social de América Latina y el Caribe. Se trata de una plataforma creada para crear datos abiertos que apoyen la investigación y el diseño de políticas públicas en el ámbito de la seguridad social.
El Observatorio de Seguridad Social trabaja en lo que se denomina una Encuesta Longitudinal de Protección Social (ELPS) en los países de Chile, Colombia, El Salvador, Uruguay, Paraguay y Brasil. Una encuesta longitudinal es un tipo de estudio observacional que investiga al mismo grupo de gente de manera repetida a lo largo de un período de años.
Este tipo de encuesta ha sido uno de los principales insumos de trabajo del Consejo Asesor Presidencial de Chile para la reforma de Pensiones, y para el proceso de elaboración y discusión de la Reforma Previsional (Ley 20.255).
Para poder acceder a estos datos abiertos y a la red de expertos de esta iniciativa, sólo basta con darse de alta en el Portal del Observatorio de Seguridad Social.
Fase 2: Procesamiento y análisis de datos
Después de la fase de generación, entramos en la fase de procesamiento de los datos. La cual, entre otras acciones, incluye el análisis descriptivo y la extracción de información a partir de diversas fuentes de datos.
Comúnmente, se disponen de datos abiertos de algún municipio pero se carece de una idea global que permita comparar el estado de dicho municipio con otros en contextos similares. Para esto, Sielocal.com, un proyecto que reutiliza datos abiertos económicos de Brasil, Colombia, Chile, Ecuador, México, Paraguay, Perú, Uruguay y España, genera reportes comparativos de municipios. A través del procesamiento de datos crudos, Sielocal ha diseñado más de 100 indicadores que ayudan a gobiernos regionales a evaluar el desempeño de las municipalidades de América Latina y el Caribe.
Actualmente, más de 600 usuarios provenientes de empresas privadas, periodistas, sector público y académicos, consultan los reportes de Sielocal para conocer el estado económico de sus municipios.
La plataforma de Sielocal dispone de varios tipos de informes. Por ejemplo, el costo municipal del servicio de recogida y tratamiento de residuos en España, el índice de ingresos tributarios de las municipalidades de Colombia, y el índice de calidad de las aulas educativas de los cantones de Ecuador, entre otros tipos de análisis. Así, los gobiernos pueden utilizar estos reportes para tomar decisiones basadas en datos y disponer de un contexto global sobre un tema concreto.
Fase 3: Generación de acciones
Finalmente, la fase de generación de acciones concretas abarca el uso de algoritmos predictivos que ayudan a tomar decisiones concretas sobre un tema.
Uno de los retos más difíciles de esta fase es facilitar la manera en que se consume la información. Los resultados de un algoritmo se deben mostrar a través de una visualización o una interfaz comprensible para la audiencia que va a consumir la información.
Por ejemplo, Crime Radar es una aplicación que a través de algoritmos de inteligencia artificial procesa datos abiertos y calcula la probabilidad de crimen en cada zona de la ciudad de Río de Janeiro en Brasil. Así, a través de una visualización muy simple como la que se muestra a continuación, las personas pueden ver la probabilidad de crimen durante las próximas horas en cada zona de la ciudad.
Esta herramienta ha sido muy útil en el transcurso de la últimas Olimpiadas para que los nuevos visitantes sepan cómo moverse a través de la ciudad.
Esperamos el análisis de estas etapas te permita entender cuál es la mejor manera de evolucionar tu proyecto para que tus datos abiertos puedan ser reutilizados por nuevas audiencias.
¿Estás trabajando en un producto basado en datos abiertos? ¿En qué fase del procesamiento te encuentras? ¡Suma tu comentario abajo!
Por José Luis Delgado Davara del Sector de Conocimiento y Aprendizaje del Banco Interamericano de Desarrollo
David Palazon Dice
Muy útil acercándose poco a poco a nuevos conceptos y utilidades del análisis de datos. Con perspectivas diferentes pero siempre de gran utilidad.