¿Cuál es el límite de usos que podemos encontrar para el Big Data?

Big Data can generate big brainstorms

 Fuente: Flickr Kevin Krejci

¿Qué tiene que ver la cantidad de veces que se re-postea un blogpost fuera de tu ciudad con su PIB? Este fin de semana leí un estudio que me asombró no sólo porque relaciona estos dos puntos, sino porque podría aportar una solución sumamente sencilla a uno de los temas más complejos de resolver en la metodología que aplicamos en la Iniciativa de Ciudades Emergentes y Sostenibles (ICES): obtener el dato sobre el PIB de ciudades emergentes.

¿Cuán fácil es conseguir el dato del PIB de una ciudad de Latinoamérica? La respuesta rápida es “depende”. Si hablamos de una de las megaciudades de la región, como Sao Paulo, México DF, Buenos Aires, etc., la respuesta es, bastante fácil. Ahora cuando pasamos a las que en el marco de la Iniciativa denominamos “emergentes” (aquellas entre 100 mil y 2 millones de habitantes que poseen crecimiento económico y demográfico por encima de la media nacional) obtener el dato es más complejo.  Para la Iniciativa de Ciudades Emergentes y Sostenibles este dato es clave, ya que como parte de la metodología realizamos una priorización de problemas locales utilizando como uno de los criterios de priorización un estudio de impacto económico sectorial de la ciudad y lo comparamos contra su PIB.

¿Cómo hacer entonces con aquellas ciudades que no lo tienen calculado su nivel de actividad económica?  Son varios los proxies convencionales que utilizan normalmente los economistas, pero el que encontré este fin de semana es el más innovador y el más “lejano” de la formalidad económica que uno esperaría. La herramienta básica para calcularlo es una que la mayoría de nosotros usamos todos los días: las redes sociales.  Un equipo de investigadores, dirigida por Carmen Vaca Ruiz, de la universidad Politecnico di Milano predijeron con precisión el PIB de 45 ciudades brasileñas utilizando datos de microblogging. Estos investigadores utilizaron datos de la plataforma de microblogging Yahoo Meme, para desarrollar una aproximación que determina la actividad económica de una ciudad.

¿Cómo lo hicieron? Los investigadores midieron el nivel de atención prestada a contenido compartido en la plataforma digital, definido como las veces que el contenido posteado por un usuario fue “re-posteado” por otros usuarios. Georeferenciaron estas acciones para calcular la distancia promedia entre los diferentes usuarios, y así dividirlas en interacciones locales, interacciones con otros usuarios de la misma ciudad, e interacciones con usuarios de lugares más lejanos.

Graph

Gráfico que muestra la ubicación geográfica de los usuarios que prestaron o recibieron atención (repostearon contenido) a y de las ciudades consideradas en el estudio. Fuente: http://researchswinger.org/publications/vaca14taking.pdf

El estudio está basado en el concepto de la “glocalidad, que se refiere a la combinación de interacciones tanto locales como globales y caracteriza no sólo las personas con una fuerte presencia en el internet, sino también las ciudades más exitosas económicamente. Las ciudades más prosperas tienden a estar involucradas en muchas interacciones tanto locales como globales. Es decir, las ciudades que faciliten el flujo internacional de información, o están estrechamente vinculadas con la economía mundial, son los actores claves en la economía mundial, por lo tanto participan activamente en la interacción global.  Sin embargo, al mismo tiempo que las ciudades exitosas ofrecen a sus residentes oportunidades para conectarse globalmente, se ha comprobado que estas también fomentan las conexiones locales.

Utilizando estas ideas, los investigadores fueron capaces de llegar a un proxy para medir la glocalidad de la ciudad, cuantificando la capacidad de los residentes de una ciudad para interactuar en lo global mientras mantiene fuertes conexiones locales, a través de medir la atención prestada a contenido local y global en la plataforma de microblogging.

Lo más impresionante es que funciona.  Su proxy de glocalidad correlaciona con el PIB real de la ciudad en un valor de casi 0.94, muy cercano a 1, que sería una correlación directa.  Los resultados del estudio revelan que la glocalidad de una ciudad, medido con datos de los medios sociales, es un índice muy razonable para estimar la actividad económica de una ciudad.

PIB Graph

El rendimiento del modelo en predecir el PIB del conjunto de 45 ciudades brasileñas.  Fuente: http://researchswinger.org/publications/vaca14taking.pdf

¿Podría esto ser una solución para nosotros? Dado que pensamos a la Iniciativa de Ciudades Emergentes y Sostenibles como una incubadora y prueba de nuevas ideas, queremos darle una oportunidad y lo vamos a probar, teniendo en cuenta ciertas limitaciones expresadas por los investigadores.

Sin embargo, lo más importante de este caso no es poder solucionar nuestro simple problema de cálculo metodológico, lo que me sorprendió es el experimento con Big Data y su potencial.  Con la proliferación de dispositivos conectados (smartphones) en las zonas urbanas, las ciudades se están convirtiendo en “ordenadores al aire libre” produciendo gran cantidad de datos valiosos sobre las actividades de sus ciudadanos todos los días. ¿Qué otras soluciones urbanas existen ahí afuera que no estamos aprovechando? Esta información podría ayudar a que nuestras ciudades ofrezcan servicios mucho más rápidos y eficientes.

En el BID, queremos estimular este tipo de ejercicios, no sólo mediante la prueba de ideas en desarrollo, sino también en su generación. Tenemos una idea con la gente del Sector de Conocimiento y Aprendizaje del BID (“KNL” por sus siglas en inglés) Les cuento esto en mi próximo post.