7 minutos de lectura.
En el marco de la realización del Development Data Partnership entre Meta (Data for Good) y el Banco Interamericano de Desarrollo (BID), bajo el Observatorio de Movilidad Urbana (OMU), se llevó adelante un proceso de investigación integral que permitió medir, calcular y validar una serie de indicadores centrales para el estudio del transporte de manera abierta, dinámica y con bajo costo en 17 ciudades de América Latina y el Caribe. Uno de los objetivos principales del proyecto fue la creación de una metodología nueva y robusta para la utilización de Big Data en el diagnóstico y la planificación de la movilidad, mediante la utilización de herramientas de código abierto y publicando los desarrollos teóricos y prácticos para la replicación sencilla en cualquier otra ciudad o conglomerado no alcanzado por el presente estudio.
Sobre los datos utilizados
Facebook recopila información de ubicación de los usuarios que tienen habilitados estos servicios en la aplicación y la utiliza para proporcionar funciones y contenido relevante dentro de la misma. La información se mantiene completamente anónima en todo el proceso de recolección y producción de datos y las bases nunca se presentan a nivel individual. Los datos de ubicación se utilizan para crear conjuntos de datos agregados llamados Facebook Disaster Maps, que muestran dónde están las personas y cómo se mueven en un momento dado. Los datos no están abiertos actualmente para el público en general pero sí para organismos sin fines de lucro, unidades académicas, universidades, gobiernos e investigadores que soliciten acceso y sean aceptados. La información para las 17 ciudades de América Latina y el Caribe se obtuvo mediante un acuerdo entre el BID y el Development Data Partnership. Estos datos se presentan en dos niveles:
- por mosaico o tiles
- por región administrativa
Cabe destacar que luego de agregada la información, Meta aplica un filtro de privacidad en los orígenes y destinos que contengan movimientos escasos y que puedan llegar a identificarse e individualizarse. La probabilidad de filtrar viajes por cuestiones de privacidad es más alta mientras los polígonos sean más pequeños y/o se encuentren más alejados. En el caso del presente estudio, las áreas de las regiones administrativas estudiadas superan los cuadrados de 2 km por lado, por lo que los movimientos registrados en las bases agregadas por región administrativa suelen ser mayores que en la agregación por mosaico, lo que asegura aún más el anonimato y la protección de los datos estudiados.
Sobre la metodología
Para avanzar con la metodología, se establecieron distintos supuestos en base a la forma en la que Facebook tomó y procesó la información primaria. La principal hipótesis que se introdujo fue que la distribución del uso de las aplicaciones de Facebook y/o el nivel de aceptación a activar la geolocalización en los dispositivos móviles a lo largo de cada una de las regiones administrativas a estudiar es heterogénea. Esto significa que según distintas características sociales, económicas, demográficas o de infraestructura, la precisión de toma de datos geolocalizados es variable a lo largo del territorio. La consecuencia inmediata de esta heterogeneidad es la posibilidad de generar imprecisiones a la hora de estimar los movimientos y distancias medias entre distritos. Es decir, se pueden sobrerrepresentar o subrepresentar estratos de la población en base a los factores mencionados. Para intentar quitar este sesgo, se introdujo el uso de un tercer dataset proveniente de Facebook, el High Resolution Density Map (HRDM). Esta base de datos contiene información oficial de la distribución de la población para la mayoría de los países del mundo, que fue procesada con distintos mecanismos de machine learning para ubicar geográficamente a cada una de las personas en un punto específico.
A partir de la intersección de los datos de población con los datos de personas que viajan, se pueden obtener factores de expansión para corregir la distribución de los viajes y las distancias medias en base a la distribución real de la población, disminuyendo considerablemente la presencia del sesgo geográfico mencionado. Además, la apertura por edad de los datos poblacionales brindados por Facebook permite un mejor ajuste, ya que los niños no están contemplados en los viajes al no tener posibilidad de tener legalmente una cuenta de red social y/o aplicación de esta.
Para validar la metodología presentada, se propuso el análisis de un caso práctico de una de las ciudades estudiadas y se comparó con fuentes oficiales de movilidad. En este caso, la región seleccionada fue la Región Metropolitana de Buenos Aires (RMBA). Esta comprende a la Ciudad Autónoma de Buenos Aires (CABA) y 40 municipios de la Provincia de Buenos Aires (PBA). Aquí habita aproximadamente el 35% de la población total de Argentina y se alcanza el 48% del Producto Bruto Interno (PBI) de este país. Con el estudio en profundidad de los datos de Facebook y con la flexibilidad para contrastarlos y aumentarlos mediante el cruzamiento con otras fuentes, (ej. datos sobre el Nivel Socioeconómico), se pudo determinar, como era de esperarse, que los patrones de desplazamiento en la RMBA están influenciados no solo por factores geográficos sino también socioeconómicos.
En cuanto a los factores geográficos, se destaca la distancia al centro urbano como un factor importante que influye en los patrones de desplazamiento. Por ejemplo, las personas que viven más lejos del centro urbano tienden a realizar desplazamientos más largos para llegar a su lugar de trabajo o estudio mientras haya una oferta de transporte (tanto público con servicios de buses o trenes, como privado con carreteras rápidas y de calidad) que permita absorber esa demanda. Esto significa que la oferta tiene un rol fundamental en la demanda observada. Si la red de transporte es extensa, la población tiene la posibilidad de efectuar recorridos largos para llegar desde su hogar al lugar de su actividad principal, ya sea trabajo, estudio o cualquier otra ocupación. Además, si las frecuencias y la infraestructura del transporte son correctas, el tiempo de viaje puede mejorar y hacer los viajes largos más accesibles y menos costosos en términos sociales y económicos. Se observó que cuando la oferta de transporte disminuye, también lo hacen las distancias medias recorridas, generando viajes más cortos en general por región administrativa. Esto sucede porque una oferta de transporte deficiente (sobre todo de transporte público) genera que la población tenga que recurrir a modos más ineficientes o inseguros para realizar sus viajes, evidenciando un desaliento a la demanda bajo estas condiciones.
En cuanto a los factores socioeconómicos, se estudió que la densidad poblacional y el Nivel Socioeconómico (NSE) también influyen en los patrones de desplazamiento. Por ejemplo, las personas que viven en zonas con alta densidad poblacional pueden tener más opciones de transporte público, pero también de desarrollo económico; por lo que realizan menos viajes largos. Los quintiles socioeconómicos más bajos realizan trayectos más largos mientras que los más altos reducen significativamente sus tiempos de traslado. Estos datos fueron validados posteriormente con indicadores oficiales como la Encuesta Permanente de Hogares (EPH, INDEC) o la Encuesta de Movilidad Domiciliaria (INDEC), ambas en Argentina.
Como conclusión, los datos generados por aplicaciones móviles, como los datos de Facebook, pueden ser utilizados para entender los patrones de desplazamiento en cualquier ciudad mediana o grande y definir políticas públicas de movilidad urbana. La metodología propuesta en el presente trabajo permitió analizar los patrones de desplazamiento a partir de datos de Facebook y validarlos con fuentes de datos oficiales más estáticas y costosas con éxito en la RMBA. Se invita a la lectura de la publicación, al acceso, al dashboard del Observatorio de Movilidad Urbana y a la obtención y expansión del código utilizado para la investigación.
Por Juan Ignacio Fulponi y Cristian Joaquín Moleres del BID.
Leave a Reply