¿Alguna vez has tenido que hacer un análisis sobre temas de desarrollo como género, empleo, infraestructura, entre otras cosas, y no has sabido cómo empezar o dónde buscar la información para avalar tu hipótesis? Este es un desafío común que los analistas, economistas, académicos y profesionales de desarrollo enfrentan a menudo.
Conscientes de este desafío, desde el BID desarrollamos una librería de R que facilita la recopilación y análisis de indicadores de diferentes temas por país. En su primera iteración, esta librería estaba enfocada en extraer indicadores para un visualizador de datos de género, sin embargo, los algoritmos se reutilizaron y se desarrolló el “Agregador de indicadores“, una librería abierta y disponible en el repositorio de código del Banco, Código para el Desarrollo. A través de esta librería podrás conocer cómo analizar indicadores, buscándolos por palabras claves, descargándolos y comparándolos.
La librería de R “Agregador de Indicadores” te permite buscar, descargar y comparar indicadores del portal de datos abiertos del BID, Números para el Desarrollo (N4D), el portal de datos del Banco Mundial y de No Ceilings.
Si sabes programar en R y quieres saber cómo utilizar esta librería, en este tutorial te explicaremos cómo hacerlo. En nuestro ejemplo, veamos paso a paso cómo analizar datos de agricultura con más de 1.000 indicadores:
1 Paso 1: Prepara el ambiente de trabajo y descarga las librerías
Necesitarás tener descargado R en tu computadora. La manera más común y fácil de utilizar R es a través del ambiente de programación (IDE) de RStudio[https://www.rstudio.com/products/rstudio/download/].
Una recomendación es utilizar un libro de notas de R (R notebook) y abrir este tutorial en RStudio. El libro de notas (Rnotebook) te permite mezclar lenguaje de texto escrito con lenguaje de programación en un mismo documento. Aquí podrás leer más sobre cómo usar R notebooks.
[code] install.packages(‘devtools’) #Librería que permite instalar librerías que no están en el repositorio CRAN.library(devtools)
install_github(‘EL-BID/Libreria-R-Numeros-para-el-Desarrollo’, force = TRUE)
install_github(‘EL-BID/Agregador-de-indicadores’, force = TRUE)
library(agregadorindicadores)
install.packages(“xlsx”) #Librería para exportar en excel
library(xlsx)
[/code]
2 Paso 2: Encuentra los indicadores relacionados con tu área de estudio
El “Agregador de Indicadores” hace una búsqueda por palabras clave de los indicadores. Imaginemos para nuestro ejemplo, que queremos hacer un análisis del sector agropecuario en los países de la región. Para ello, haremos una búsqueda de indicadores relacionados con “agricultura”.
Utilizando la función “ind_search” y la palabra clave “agricultura”, la librería encontrará todos los indicadores de N4D, el Banco Mundial y No Ceilings con la palabra “agricultura” en el nombre o en la descripción. (Utiliza el comando “?ind_search” para saber más)
[code] # Encuentra todos los indicadores relacionados con la palabra claveind<-ind_search(pattern=”agriculture|agricultura”, fields = c(“indicator”, “ind_description”, “topic”), extra = TRUE)
sprintf(“Número de indicadores encontrados: %s”, nrow(ind))
# Muestra en pantalla 5 indicadores
head(ind$indicator, 5)
# Muestra en pantalla los temas de los indicadores encontrados
# unique(ind$topic)
[/code]
En este caso, la librería ha encontrado 285 indicadores, si quieres ver con más detalle los indicadores encontrados, puedes utilizar el comando “View()” o puedes exportar los datos en un archivo .xls. Estos son algunos de los indicadores encontrados:
- Exports by Sector: Agricultural Raw Materials (%) [Código: INT_5892]
- Imports by Sector: Agricultural Raw Materials (Percentage) [Código: INT_15892]
- % of Workers in Agriculture, Hunting, Forestry, and Fishing [Código: SOC_049]
#Exporta en excel el listado de nombres los indicadores
write.xlsx(ind, “indicadores.xlsx”)
[/code]
3 Paso 3: Análisis de un indicador
Con el comando “ai()” puedes descargar los datos del indicador de interés. Veamos cómo visualizar la evolución de un indicador para cinco países:
[code] Workers = ai(indicator = “SOC_049”, country = c(“BO”,”MX”,”SV”,”CO”,”GT”))#Visualízalo en una gráfica
ggplot(data=Workers, aes(x=year, y=value, group=country, colour=country)) + ggtitle(“% de los trabajadores en agricultura, caza, silvicultura y pesca”) +
geom_line() + ylim(0, 65)
geom_point()
[/code]
Ahora, veamos cómo ha evolucionado con los años el porcentaje de trabajadores en otro sector, el sector de servicios.
[code] Services = ai(indicator = “SL.SRV.EMPL.ZS”, country = c(“BO”,”MX”,”SV”,”CO”,”GT”))ggplot(data=Services, aes(x=year, y=value, group=country, colour=country)) + ggtitle(“% de los trabajadores en el sector servicios”) +
geom_line() + ylim(0, 65)
geom_point()
[/code]
Con esta comparación, podemos observar que los trabajos relacionados con la agricultura y pesca están decayendo, mientras que en el sector de servicios, la tendencia es a crecer. Las figuras 1 y 2 muestran además que Guatemala y Bolivia tienen economías más centradas en el sector primario (agricultura y otros), a diferencia de Colombia y México que tienen mayor número de personas empleadas en el sector terciario (servicios).
4 Paso 4: Análisis de un país
Ahora supongamos que escogemos un solo país para compararlo desde una perspectiva más amplia con otros de la región. En nuestro caso, analizaremos Colombia, y queremos saber en qué indicadores el país se destaca frente a otros países.
Para ello, la librería nos ofrece la función de normalizar cada indicador respecto a la media de todos los países. De esta manera podemos comparar un indicador con otro para cada país y año, e identificar aquellos sectores donde el país se destaca o necesita mejorar. Esta nota en el repositorio de la librería al detalle este concepto.
Veamos entonces en qué se destaca Colombia dentro del sector agropecuario para el año 2015 según los indicadores descargados en este ejemplo.
[code] # Descarga los datos de cada uno de los indicadores de agricultura para ColombiaData_agriculture = ai(indicator = ind$src_id_ind)
#Normaliza los valores de los indicadores
Data_agriculture_norm = ai_normalize(Data_agriculture)
# Filtra y ordena de mayor a menor los indicadores según los valores normalizados
Data_agriculture_norm = Data_agriculture_norm %>% filter(country == “Colombia” & year == “2015”) %>% arrange(desc(value_norm))
TOP10 = head(Data_agriculture_norm$indicator, n=10)
Print
write.xlsx(Data_agriculture_norm, “Data_agriculture_norm.xlsx”)
[/code]
Como se puede leer en los comentarios, el código anterior descarga los datos de los indicadores para todos los países, los normaliza por indicador y extrae los de Colombia ordenados de mayor a menor. Esto permite destacar los indicadores que resaltan con respecto al resto de países:
De la imagen anterior podemos subrayar que Colombia, en 2015, se destacó entre otros países por el alto porcentaje de empleo informal en sectores diferentes a la agricultura. Además, también podemos decir que el porcentaje de empleo masculino en agricultura resalta con respecto a otros países.
A pesar de que este análisis nos ha permitido sacar algunas conclusiones rápidas, cabe señalar que el motivo de este ejemplo es meramente demostrativo y vale la pena contrastarlas y estudiarlas en profundidad.
Esperamos que te haya parecido útil este tutorial y te animes a utilizar esta librería para tus propios análisis. Puedes descargar del repositorio de Código para el Desarrollo esta herramienta y ejecutarla desde el ambiente de RStudio.
Por José Luis Delgado Davara de la División de Gestión del Conocimiento del Banco Interamericano de Desarrollo.
Daniela Dice
Me encantó este artículo, deberían tener una pequeña escuela de coding para muy, muy principiantes.
Arturo Constante Dice
Gracias José Luis,
Probaremos la herramienta y sería muy útil poder comparar los indicadores ideales y promedio con los que deseamos evaluar, saludos.
Paulina Donoso Dice
Por qué no toman en cuenta datos de más países? Ecuador o Perú, por ejemplo, están considerados… 🙁
Woody Dice
Hay un error en el código: dice ind<- debería decir ind <-
Woody Dice
Sobre lo que acabo de comentar. En algunos navegadores,como mozilla, no se visualiza la flecha, solo texto siguiente & lt ;-
Samuel Saldaña Dice
Buenas, he probado las indicaciones para bajar la data, y manipular los indicadores pero envían errores.
Empezando por esta sección:
# Encuentra todos los indicadores relacionados con la palabra clave
ind<-ind_search(pattern=”agriculture|agricultura”, fields = c(“indicator”, “ind_description”, “topic”), extra = TRUE)
sprintf(“Número de indicadores encontrados: %s”, nrow(ind))
# Muestra en pantalla 5 indicadores
head(ind$indicator, 5)
# Muestra en pantalla los temas de los indicadores encontrados
# unique(ind$topic)
VERSUS ESTE QUE ACOMODÉ, PERO SIN OBTENER NINGUN B. DATOS:
?ind<<-ind_search(pattern="agriculture|agricultura", fields = c("indicator", "ind_description", "topic"), extra = TRUE)
sprintf("Número de indicadores encontrados: %s", nrow(?ind<))
SUGERENCIA:
Colocar además, el file sin errores, sin los pasos.
Gracias, y saludos atentos.
Samuel Saldaña