Por Iván Gonzalez, Ecólogo Pontificia Universidad Javeriana. Bogotá, Colombia
Hace algunos meses tuve el agrado de participar en una convocatoria anunciada por el Banco Interamericano de Desarrollo en la que se pedían maneras novedosas de utilizar los datos del portal Números para el Desarrollo.
Mi propuesta, que resultó ganadora de la convocatoria, analizó los datos sobre la balanza comercial de Colombia. El objetivo de mi análisis era evaluar la dependencia del país a dinámicas internacionales (regionales particularmente), la producción interna y el tipo de importaciones que se requieren.
A continuación, te cuento los pasos que seguí y que podes implementar en el portal de datos abiertos del BID.
Elegir las variables
El primer paso para seleccionar el tema es explorar las variables del portal y su comportamiento. En mi caso de estudio, decidí hacer un análisis explicativo donde se relacionaran más de una variable. Para ello, descargué algunas de las variables disponibles (importaciones y exportaciones de varios sectores, índices Gini, proxys de acceso a agua potable y sobrepoblación, entre otras) para hacer un análisis exploratorio (gráficos correlativos).
El resultado de este primer paso fue la selección de las variables finales que se irían a analizar y a descargar para todos los países.
Comparar la información por país
Una vez descargadas las variables se creó un archivo que contuvo la información de todos los países por cada una de las variables.
Dado que hubo variables de flujo de mercancías (exportaciones e importaciones) consideré que era posible generar un análisis de comercio entre países respecto a Colombia. Es por esto que ahora se tendría un análisis explicativo y otro de flujo.
Los análisis explicativos se basaron en correlaciones de Pearson. Con esta prueba se pretende ver una relación lineal entre las variables. Las relaciones pueden ser positivas o negativas y su fuerza se evalúa a través del parámetro de correlación r. Adicionalmente se realizaron gráficas exploratorias para evidenciar esta asociación de variables y se discriminó por países. Esta gráfica se muestra como ejemplo para 5 de las 17 variables iniciales.
Analizar correlaciones
Se seleccionaron los pares de variables que tuvieran un coeficiente de correlación mayor a 0.6 o menores a -0.6, ya que el parámetro toma valores de -1 a 1.
Las variables con algún grado de asociación seleccionados se evaluaron y se generó una gráfica de dispersión ajustando un modelo lineal pos país. Esto permite ver no sólo la relación entre los pares de variables sino evaluar el comportamiento de cada país.
Se encontraron seis (6) relaciones relevantes, tres (r) positivas y dos (2) negativas.
La primera relación positiva fue entre las importaciones de materias primas de agricultura y la exportación de manufacturas. Esta relación fue positiva también para todos los países y puede indicar que todos los países de la región nivelan la falta o exceso de producción de materias primas con productos adelantados en la cadena de valor.
La segunda relación positiva fue entre las importaciones de materias primas de agricultura y la exportación de combustibles. Esta relación fue positiva para casi todos los países e indica que cuando los países tienen capacidad de producir combustibles prefieren comprar insumos agrícolas que producirlos.
La última relación positiva fue entre las importaciones de alimentos y la exportación de combustibles. Esta relación fue positiva para casi todos los países e indica que cuando los países tienen capacidad de producir combustibles prefieren comprar alimentos agrícolas que producirlos. Esto puede dar una alerta sobre la dependencia de la alimentación de las personas en recursos no renovables y económicamente dinámicos como los combustibles.
La primera relación negativa se generó entre el índice de hacinamiento y el acceso a instalaciones de agua potable. Esto se explica porque cuanto más número de personas existen en un área más difícil resulta para cada persona acceder a algún recurso no escalable como el agua. Mientras la población crece de manera exponencial en el tiempo el agua y las instalaciones de potabilización son en muchas ocasiones estáticas o decrecientes.
La segunda relación negativa se presentó entre el índice de hacinamiento nuevamente y las importaciones de materias para agricultura. Entre menos importan los países este tipo de productos, más hacinamiento se tiene. Esto especialmente evidente en países como México y Brasil. La escala de esta gráfica está en log-log para poder reducir el efecto de valores muy altos en la visualización. No puedo plantar hipótesis para explicar el comportamiento de los datos en caso.
Conclusiones
Los análisis correlativos indicaron la asociación para algunas variables que pueden ser relevantes para los países, como por ejemplo la relación entre importación de alimento y exportación de combustible, ya que puede evaluar su comportamiento a lo largo de la historia.
Por otro lado, en el análisis de flujos se construyó una gráfica circular que muestra las transferencias con demás países. Las exportaciones hacia Colombia se ilustran en azul. Con este resultado se pudo concluir que:
- Colombia depende de importaciones de países importantes de la región, especialmente México y Brasil.
- Sin embargo, se observa que este balance no se ve de manera recíproca ya que las exportaciones colombianas a esos países son menores a lo que se les compra.
- Las principales exportaciones de Colombia provienen de los países vecinos: Venezuela, Ecuador, Perú y Chile.
¿Cómo has utilizado tu el portal de datos abiertos del BID, Números para el Desarrollo? ¡Suma tu comentario abajo!
Ricardo Claverías Huerse Dice
Interesante.ahora me gustaría que expòngan cómo analizar impactos con línea de base y luego de un tiempo determinado los impactos, por ejemplo, de determinadas políticas de desarrollo y hacer análisis multivariado predictivos, para sobre esa base elaborar una nueva plaficación estrategia de desarrollo territorial.
Fidencio Vargas Dávila Dice
Qué ilustrativo estudio! Quisiera tener el trabajo completo en formato PDF. ¿Es posible?
Atte. Fidencio Vargas Dávila
alba torrejano Dice
Felicitaciones … es muy importante tanto como saber recoger datos como exponerlos de ello dependen las acciones a seguir . Me encantaría utilizar mas la herramienta en temas de mi region.
Noticias yopal Dice
Bastante bueno tu artículo, soy ingeniero de sistemas y veo aquí como se puede aplicar de manera efectiva el big data. Con la caída del petroleo, América Latina tiene que que buscar soluciones a las posibles crisis económicas que se vengan.
Jessica Dice
Me interesa saber si alguien ha realizado algún estudio de la relación de la delincuencia y otras variables de la economía y que como resultado de dicho trabajo se ha implementado medidas correctivas con éxito. Gracias.
Marco Luiz Garcia Dice
Todo está muy bien, pero hay que recordar que no son factores de causa-efecto; también se me hace que confunde el término hacinamiento con el de alta densidad demográfica
Jose Bedolla Dice
Tienes mucha razón, Marco Luiz, la correlación no es sinónimo de causalidad, como parece implicar el texto. Saludos.
Angel Araujo P. Dice
Interesante metodología, así como la manera de interpretar los datos dse forma correlativa. Felicitaciones
Marita Beguerí Pagés Dice
Interesante uso del portal y de los datos mediante analisis estadísticos que dan resultados muy relevante y sólidos
María del Pilar Guerra Galán Dice
Muy interesante y útil. Felicitaciones!!!
Jacquelin Santana Dice
Interesante tu exposicion y bien ilustrado. Felicidades!!
Juan Francisco Dice
Excelente…Me dio algunas ideas, y sobre todo me siento inspirado en utilizar el portal del BID. Su trabajo, compañero, es muy ilustrativo y generador de ideas. Que gusto.
René Dice
Muy interesante!! Lo importante es esto, el utilizar a favor y en positivo, el Big Data!!
JAVIER GONZÁLEZ Dice
Muy interesante, felicitaciones
vilma Chamorro Dice
Resulta novedoso los resultados del análisis de correlación, felicitaciones.
Laura Ortega Dice
Excelente trabajo muy interesante!
FRANCISCO JAVIER GÁLVEZ G Dice
No puedo quedarme sin expresarle mis sinceras Felicitaciones por el trabajo realizado. Es un buen aporte para la investigación y el proceso de desarrollo de políticas. Además, es un ejemplo de dedicación como requisito para un investigador. Gracias Iván
Rosario Flores Dice
Felicitaciones Iván, tú trabajo me resultó de gran interés además de ilustrativo.Dónde puedo acceder al trabajo completo?
Cesar Augusto Pardo Chamorro Dice
Ivan felicitaciones, la única duda que me asalta, es que nuestro país en esa deshonestidad en su información permita generar una toma de decisiones basado en datos que han sido alterados en el transcurso del tiempo. Sería interesante hacer un análisis si en verdad los datos que correlacionamos son reales o no. Y de esa forma aprovechar ese excelente trabajo suyo en indicarle a los mandatarios de nuestro país, lo importante de plasmar datos reales para adoptar políticas públicas efectivas y de esa forma podemos beneficiarnos todos en este análisis, para los que somos empresarios adoptemos las decisiones para mejorar no solo nuestro negocio sino contribuir a nuestro país. Felicitaciones por ese trabajo.
Barbara Silva Dice
Que buen trabajo y buen ejemplo de cómo utilizar los datos del portal, me gustaría saber en más detalle cómo realizó el gráfico, qué programa fue ocupado.
gracias,
Verónica Velasco V Dice
Interesante comentario
Muchas felicidades, excelente su ejercicio. Saludos
Valeria Dice
Muy interesante el estudio. Es muy amplio todo el trabajo que se puede hacer a partir de la existencia de datos sistematizados. Gracias, saludos.
Laura Mota Díaz Dice
Hasta ahora estoy empezando a conocer el portal Números para el Desarrollo; lo que puedo decir es que es una base de datos muy importante para diversos análisis encaminados a la formulación y evaluación de políticas públicas.
El ejemplo que aquí se nos presenta es muy ilustrativo.
Javier castellanos Dice
Interesante el estudio
Edith Dice
Sobre la segunda relación negativa, entre el índice de hacinamiento y las importaciones de materias para agricultura, me gustaría saber si a lo largo del tiempo entre tu estudio y la fecha actual has logrado explicar el comportamiento de estos datos. A simple vista, lo que se me ocurre es que pudiera tener un impacto como uno de muchos factores que afectan en la salud de la población, por parte de sus hábitos de alimentación y el acceso a alimentos nutricionalmente valiosos.
David Ortiz Huilcaya Dice
Estimado Ivan,:
Excelente aporte a la investigación, el mismo que genera valor.
Saludos,
David
Edith Rangel Dice
¡Qué maravilla!, la interpretación de la correlación de variables es muy ilustrativa y enriquecedora.
Estrella Asenjo Valdivieso Dice
Buen ejemplo de generación de conocimiento con datos abiertos. Felicitaciones!.
Luis Alberto Díaz De Luna Dice
La información me resultó muy reveladora sobre las oportunidades que brinda el utilizar el portal “Números para el Desarrollo”, agradezco por compartirla!
Andrea Paico Dice
súper interesante! me ha dado ideas a aplicar.
Maritza Romero Dice
Es un excelente trabajo de análisis y visualización de resultados.
Agradecería poder consultar el proceso completo.
Richard Ibanez Dice
El análisis que hace sobre el “cuanto más número de personas existen en un área más difícil resulta para cada persona acceder a algún recurso no escalable como el agua”, considero que es al contrario, que debido a la escasez de agua, la gente se concentra más en aquellos sitios donde el agua es disponible. Sin embargo lo felicito por ese trabajo y esfuerzo que le dedicó al ejercicio, ya que nos sirve de guía a los que vamos detrás en la formación.
Diana Carolina Sandoval Castro Dice
Hasta ahora estoy realizando el Curso de Análisis de Datos – BID, pero estoy fascinada, encantada y agradecida con ustedes por este espacio, pues sé que al igual que yo, muchos otros ciudadanos del mundo, tienen puestos sus ojos en países subdesarrollados con el fin de un día aportar en la elaboración e implementación de políticas públicas efectivas.
juan carlos alarcon de leon Dice
analisis herramienta propicia para ayudarnos y tomar conciencia de los cambios excelente trabajo seguiré estudiando este tema.