Banco Interamericano de Desarrollo
facebook
twitter
youtube
linkedin
instagram
Abierto al PúblicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoKreatopolisMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente ¿Y si hablamos de igualdad?Inicio
Administración pública Agua y saneamiento Ciencia, tecnología e innovación Comercio e integración regional Conocimeinto Abierto Desarrollo infantil temprano Desarrollo urbano y vivienda Educación Energía Género y diversidad Impacto Industrias Creativas Medio ambiente, cambio climático y Salvaguardias Política y gestión fiscal Salud Sin Miedos Trabajo y pensiones
  • Skip to content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Abierto al Público

  • INICIO
    • Sobre este blog
    • Guía editorial
  • CATEGORÍAS
    • Datos Abiertos
    • Código Abierto
    • Gestión del Conocimiento
    • Aprendizaje Abierto
    • Sistemas Abiertos
  • Autores
  • Español
cómo analizar indicadores

¿Cómo analizar más de 1.000 indicadores de desarrollo de diferentes fuentes con una misma herramienta?

enero 16, 2018 Por José Luis Delgado | 6 Comentarios


Por José Luis Delgado Davara de la División de Gestión del Conocimiento del Banco Interamericano de Desarrollo

¿Alguna vez has tenido que hacer un análisis sobre temas de desarrollo como género, empleo, infraestructura, entre otras cosas, y no has sabido cómo empezar o dónde buscar la información para avalar tu hipótesis? Este es un desafío común que los analistas, economistas, académicos y profesionales de desarrollo enfrentan a menudo.

Conscientes de este desafío, desde el BID desarrollamos una librería de R que facilita la recopilación y análisis de indicadores de diferentes temas por país. En su primera iteración, esta librería estaba enfocada en extraer indicadores para un visualizador de datos de género, sin embargo, los algoritmos se reutilizaron y se desarrolló el “Agregador de indicadores“, una librería abierta y disponible en el repositorio de código del Banco, Código para el Desarrollo. A través de esta librería podrás conocer cómo analizar indicadores, buscándolos por palabras claves, descargándolos y comparándolos.

La librería de R “Agregador de Indicadores” te permite buscar, descargar y comparar indicadores del portal de datos abiertos del BID, Números para el Desarrollo (N4D), el portal de datos del Banco Mundial y de No Ceilings.

Si sabes programar en R y quieres saber cómo utilizar esta librería, en este tutorial te explicaremos cómo hacerlo. En nuestro ejemplo, veamos paso a paso cómo analizar datos de agricultura con más de 1.000 indicadores:

1 Paso 1: Prepara el ambiente de trabajo y descarga las librerías

Necesitarás tener descargado R en tu computadora. La manera más común y fácil de utilizar R es a través del ambiente de programación (IDE) de RStudio[https://www.rstudio.com/products/rstudio/download/].

Una recomendación es utilizar un libro de notas de R (R notebook) y abrir este tutorial en RStudio. El libro de notas (Rnotebook) te permite mezclar lenguaje de texto escrito con lenguaje de programación en un mismo documento. Aquí podrás leer más sobre cómo usar R notebooks.

[code] install.packages(‘devtools’) #Librería que permite instalar librerías que no están en el repositorio CRAN.
library(devtools)
install_github(‘EL-BID/Libreria-R-Numeros-para-el-Desarrollo’, force = TRUE)
install_github(‘EL-BID/Agregador-de-indicadores’, force = TRUE)
library(agregadorindicadores)
install.packages(“xlsx”) #Librería para exportar en excel
library(xlsx)
[/code]

2 Paso 2: Encuentra los indicadores relacionados con tu área de estudio

El “Agregador de Indicadores” hace una búsqueda por palabras clave de los indicadores. Imaginemos para nuestro ejemplo, que queremos hacer un análisis del sector agropecuario en los países de la región. Para ello, haremos una búsqueda de indicadores relacionados con “agricultura”.

Utilizando la función “ind_search” y la palabra clave “agricultura”, la librería encontrará todos los indicadores de N4D, el Banco Mundial y No Ceilings con la palabra “agricultura” en el nombre o en la descripción. (Utiliza el comando “?ind_search” para saber más)

[code] # Encuentra todos los indicadores relacionados con la palabra clave
ind<-ind_search(pattern=”agriculture|agricultura”, fields = c(“indicator”, “ind_description”, “topic”), extra = TRUE)

sprintf(“Número de indicadores encontrados: %s”, nrow(ind))
# Muestra en pantalla 5 indicadores
head(ind$indicator, 5)

# Muestra en pantalla los temas de los indicadores encontrados
# unique(ind$topic)
[/code]

En este caso, la librería ha encontrado 285 indicadores, si quieres ver con más detalle los indicadores encontrados, puedes utilizar el comando “View()” o puedes exportar los datos en un archivo .xls. Estos son algunos de los indicadores encontrados:

  • Exports by Sector: Agricultural Raw Materials (%) [Código: INT_5892]
  • Imports by Sector: Agricultural Raw Materials (Percentage) [Código: INT_15892]
  • % of Workers in Agriculture, Hunting, Forestry, and Fishing [Código: SOC_049]
[code] View(ind)
#Exporta en excel el listado de nombres los indicadores
write.xlsx(ind, “indicadores.xlsx”)
[/code]

3 Paso 3: Análisis de un indicador

Con el comando “ai()” puedes descargar los datos del indicador de interés. Veamos cómo visualizar la evolución de un indicador para cinco países:

[code] Workers = ai(indicator = “SOC_049”, country = c(“BO”,”MX”,”SV”,”CO”,”GT”))
#Visualízalo en una gráfica
ggplot(data=Workers, aes(x=year, y=value, group=country, colour=country)) + ggtitle(“% de los trabajadores en agricultura, caza, silvicultura y pesca”) +
geom_line() + ylim(0, 65)
geom_point()
[/code]

análisis de un indicador

 

Ahora, veamos cómo ha evolucionado con los años el porcentaje de trabajadores en otro sector, el sector de servicios.

[code] Services = ai(indicator = “SL.SRV.EMPL.ZS”, country = c(“BO”,”MX”,”SV”,”CO”,”GT”))

ggplot(data=Services, aes(x=year, y=value, group=country, colour=country)) + ggtitle(“% de los trabajadores en el sector servicios”) +
geom_line() + ylim(0, 65)
geom_point()
[/code]

análisis de un indicador

Con esta comparación, podemos observar que los trabajos relacionados con la agricultura y pesca están decayendo, mientras que en el sector de servicios, la tendencia es a crecer. Las figuras 1 y 2 muestran además que Guatemala y Bolivia tienen economías más centradas en el sector primario (agricultura y otros), a diferencia de Colombia y México que tienen mayor número de personas empleadas en el sector terciario (servicios).

4 Paso 4: Análisis de un país

Ahora supongamos que escogemos un solo país para compararlo desde una perspectiva más amplia con otros de la región. En nuestro caso, analizaremos Colombia, y queremos saber en qué indicadores el país se destaca frente a otros países.

Para ello, la librería nos ofrece la función de normalizar cada indicador respecto a la media de todos los países. De esta manera podemos comparar un indicador con otro para cada país y año, e identificar aquellos sectores donde el país se destaca o necesita mejorar. Esta nota en el repositorio de la librería al detalle este concepto.

Veamos entonces en qué se destaca Colombia dentro del sector agropecuario para el año 2015 según los indicadores descargados en este ejemplo.

[code] # Descarga los datos de cada uno de los indicadores de agricultura para Colombia
Data_agriculture = ai(indicator = ind$src_id_ind)

#Normaliza los valores de los indicadores
Data_agriculture_norm = ai_normalize(Data_agriculture)

# Filtra y ordena de mayor a menor los indicadores según los valores normalizados
Data_agriculture_norm = Data_agriculture_norm %>% filter(country == “Colombia” & year == “2015”) %>% arrange(desc(value_norm))

TOP10 = head(Data_agriculture_norm$indicator, n=10)
Print
write.xlsx(Data_agriculture_norm, “Data_agriculture_norm.xlsx”)
[/code]

Como se puede leer en los comentarios, el código anterior descarga los datos de los indicadores para todos los países, los normaliza por indicador y extrae los de Colombia ordenados de mayor a menor. Esto permite destacar los indicadores que resaltan con respecto al resto de países:

indicadores de agricultura

De la imagen anterior podemos subrayar que Colombia, en 2015, se destacó entre otros países por el alto porcentaje de empleo informal en sectores diferentes a la agricultura. Además, también podemos decir que el porcentaje de empleo masculino en agricultura resalta con respecto a otros países.

A pesar de que este análisis nos ha permitido sacar algunas conclusiones rápidas, cabe señalar que el motivo de este ejemplo es meramente demostrativo y vale la pena contrastarlas y estudiarlas en profundidad.

Esperamos que te haya parecido útil este tutorial y te animes a utilizar esta librería para tus propios análisis. Puedes descargar del repositorio de Código para el Desarrollo esta herramienta y ejecutarla desde el ambiente de RStudio.


Archivado Bajo:Código Abierto Etiquetado con:#HerramientasParaDatos #LibreríaDeR Código para el Desarrollo Más Leídos R

José Luis Delgado

José Luis trabaja en el Banco Interamericano de Desarrollo como gestor de proyectos digitales en el departamento del conocimiento y aprendizaje. Se graduó de ingeniería industrial en la Universidad Carlos III de Madrid y cursó un año académico en la Universidad de Puerto Rico (Mayaguez). Después de trabajar varios años para el grupo Galileo Ingeniería y Servicios, empresa desarrolladora de software para administraciones públicas, decidió especializarse en la gestión de datos. Tomó un curso en Harvard Extensión School de Business Intelligence y se especializó con un master en Big Data y Análisis de Negocio en el Instituto de Empresa (IE). Actualmente está involucrado en proyectos digitales y de Big Data en el Banco Interamericano de Desarrollo.

Reader Interactions

Comentarios

  1. Daniela Dice

    enero 17, 2018 heure 12:40 pm

    Me encantó este artículo, deberían tener una pequeña escuela de coding para muy, muy principiantes.

    Responder
  2. Arturo Constante Dice

    enero 19, 2018 heure 1:02 am

    Gracias José Luis,
    Probaremos la herramienta y sería muy útil poder comparar los indicadores ideales y promedio con los que deseamos evaluar, saludos.

    Responder
  3. Paulina Donoso Dice

    enero 31, 2018 heure 9:13 am

    Por qué no toman en cuenta datos de más países? Ecuador o Perú, por ejemplo, están considerados… 🙁

    Responder
  4. Woody Dice

    enero 31, 2018 heure 9:15 am

    Hay un error en el código: dice ind<- debería decir ind <-

    Responder
  5. Woody Dice

    enero 31, 2018 heure 9:16 am

    Sobre lo que acabo de comentar. En algunos navegadores,como mozilla, no se visualiza la flecha, solo texto siguiente & lt ;-

    Responder
  6. Samuel Saldaña Dice

    abril 12, 2018 heure 3:11 pm

    Buenas, he probado las indicaciones para bajar la data, y manipular los indicadores pero envían errores.

    Empezando por esta sección:

    # Encuentra todos los indicadores relacionados con la palabra clave
    ind<-ind_search(pattern=”agriculture|agricultura”, fields = c(“indicator”, “ind_description”, “topic”), extra = TRUE)
    sprintf(“Número de indicadores encontrados: %s”, nrow(ind))
    # Muestra en pantalla 5 indicadores
    head(ind$indicator, 5)
    # Muestra en pantalla los temas de los indicadores encontrados
    # unique(ind$topic)

    VERSUS ESTE QUE ACOMODÉ, PERO SIN OBTENER NINGUN B. DATOS:

    ?ind&lt<-ind_search(pattern="agriculture|agricultura", fields = c("indicator", "ind_description", "topic"), extra = TRUE)
    sprintf("Número de indicadores encontrados: %s", nrow(?ind&lt))

    SUGERENCIA:

    Colocar además, el file sin errores, sin los pasos.

    Gracias, y saludos atentos.

    Samuel Saldaña

    Responder

Deja un comentario Cancelar respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Primary Sidebar

SIGUENOS

Subscribe

Sobre este blog

El conocimiento abierto se define como conocimiento accesible, libre de uso, y gratuito a su usuario. Este concepto es parte de un movimiento que busca generar soluciones para el bien público de manera colaborativa. En “Abierto al Público” exploramos el uso del conocimiento abierto a través de los datos, el código y otros medios.

Buscar

Explorar temas

#ConDatos #ConocimientoAbierto #Mapaton #ObjetivosDeDesarrolloSostenible #ODS #OpenDataDay Acceso Abierto Acceso a la información Acceso digital Análisis de datos Aprendizaje de los proyectos de desarrollo Big Data Blockchain Ciencia abierta Colaboración abierta Conceptos básicos Creative Commons Crowdsourcing Código para el Desarrollo Emprendedores Estrategias efectivas Fracaso Gobierno Abierto Hackatones Innovación Innovación Abierta Inteligencia Artificial IODC Lecciones Aprendidas Metodologías Colaborativas MOOCs Más Leídos Números para el Desarrollo Open Street Map Participación ciudadana Periodismo de datos Plataformas participativas Procesamiento del Lenguaje Natural software libre Software reutilizado Startups Superhéroes del Desarrollo Trabajo en equipo Transparencia Visualización de datos

Publicaciones similares

  • ¡Libera los datos encerrados en archivos PDF!
  • Conoce Gmapsdistance: la herramienta que te permite calcular distancias de forma masiva
  • ¡El código es del público! Celebra el primer cumpleaños de Código para el Desarrollo
  • Los artículos más leídos del 2018
  • Conoce el Clasificador de Datos Atípicos

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube
youtube

Blogs escritos por empleados del BID:

Copyright © Banco Interamericano de Desarrollo ("BID"). Este trabajo está disponible bajo los términos de una licencia Creative Commons IGO 3.0 Reconocimiento-No comercial-Sin Obras Derivadas. (CC-IGO 3.0 BY-NC-ND) y pueden reproducirse con la debida atribución al BID y para cualquier uso no comercial. No se permite ningún trabajo derivado. Cualquier disputa relacionada con el uso de las obras del BID que no se pueda resolver de manera amistosa se someterá a arbitraje de conformidad con el reglamento de la CNUDMI. El uso del nombre del BID para cualquier otro propósito que no sea la atribución, y el uso del logotipo del BID estarán sujetos a un acuerdo de licencia escrito por separado entre el BID y el usuario y no está autorizado como parte de esta licencia CC-IGO. Tenga en cuenta que el enlace proporcionado anteriormente incluye términos y condiciones adicionales de la licencia.


Blogs escritos por autores externos:

Para preguntas relacionadas con los derechos de autor para autores que no son empleados del BID, por favor complete el formulario de contacto de este blog.

Las opiniones expresadas en este blog son las de los autores y no necesariamente reflejan las opiniones del BID, su Directorio Ejecutivo o los países que representan.

Atribución: además de otorgar la atribución al respectivo autor y propietario de los derechos de autor, según proceda, le agradeceríamos que incluyera un enlace que remita al sitio web de los blogs del BID.



Política de privacidad

Banco Interamericano de Desarrollo

Aviso Legal

Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

facebook
twitter
youtube