Antonio Moneo, Michelle Marshall e Jose Luis Delgado*
Nos dias 2 e 3 de dezembro de 2016 aconteceu no Rio de Janeiro o evento Alerta Zika!, a primeira expedição de dados organizada pelo BID para abordar a problemática da Zika e outras doenças transmitidas pelo mosquito Aedes Aegypti como a Dengue e a Chikungunya. O evento foi organizado em parceria com a Fundação Getúlio Vargas (FGV), a Pontifícia Universidade Católica (PUC) do Rio de Janeiro e a Secretaria Municipal de Saúde do Rio (SMS). Também colaboraram no evento Lab.Rio, Carto e Amazon Web Services.
O objetivo desta expedição de dados foi experimentar como utilizar o “big data” para melhorar a maneira de resolver problemas de desenvolvimento. Para isso, e em resposta ao desafio lançado pela Secretaria Municipal de Saúde do Rio, nos concentramos em desenhar algoritmos capazes de predizer se neste verão haverá uma nova epidemia de Zika.
Para resolver o desafio, os participantes contaram com mais de dez conjuntos de dados, ou dataset, com dados clínicos, ambientais e epidemiológicos. A principal base de dados, com incidências notificadas à Secretaria de Saúde de infecções por alguma doença transmitida pelo mosquito, continha mais de 110.000 observações e 55 variáveis.
Durante o fim de semana foram apresentados cinco projetos dos quais três foram ganhadores do desafio. A seguir, detalhamos em que consistiu cada um deles:
1 – Zika Dash
A equipe Zika Dash desenvolveu uma plataforma online que cruza dados epidemiológicos e ambientais para mapear a incidência de Zika nos bairros do Rio de Janeiro e permite visualizar como a doença se propagou entre 2015 e 2016. Esta visualização tem como objetivo facilitar a detecção das zonas mais afetadas pela doença e tomar medidas preventivas. Para apoiar seu estudo, esta equipe considerou uma análise estatística que demonstrou uma correlação evidente entre os casos de Zika, Dengue e Chikungunya na cidade do Rio.
As visualizações gráficas, as análises baseadas em estudos estatísticos e as respostas concretas às perguntas do Ministério, levaram esta equipe, de estudantes da pós-graduação em matemática aplicada na FGV, a apresentar seu projeto no evento AULA BID.
2 – Z302
Z302, uma equipe formada por três estudantes da PUC do Rio, baseou seu trabalho na premissa de que os dados dos surtos de Zika estavam diretamente relacionados à situação geográfica dos pacientes. Para isso, criaram um modelo regressivo utilizando dados epidemiológicos, sociais e ambientais para prever o comportamento do surto na cidade. Utilizaram linguagem de programação Python com as bibliotecas de código aberto Theano DeepLearning Library e OpenLayers Library para visualização de mapas. Finalmente, também se apoiaram na ferramenta Carto, aplicação web especializada na visualização cartográfica de dados e em seus módulos de predição.
3 – Alerta Zika
A equipe Alerta Zika desenvolveu visualizações de dados em nível exploratório para determinar a correlação entre o número de casos detectados e outras variáveis, como a temperatura ou o índice de desenvolvimento humano para os diferentes bairros do Rio. Mediante um dashboard com diferentes métricas, esta equipe pôde identificar correlações entre as bases de dados com incidências clínicas, dados climáticos e variáveis do IDHM, Atlas do Desenvolvimento Humano no Brasil, que considera as mesmas dimensões do IDH Global: longevidade, educação e renda, mas adequada ao contexto brasileiro e utilizando outros indicadores nacionais.
4 – Zika Trends
A equipe Zika Trends, formada por estudantes da graduação da FGV, empregou um algoritmo de classificação utilizando como variável objetiva a tendência epidemiológica (ascendente, descendente, estável) das três doenças, por bairro e por semana. Com esta informação, buscou-se conseguir uma capacidade de predição de até duas semanas e poder incrementar a capacidade de antecipação do município. Para as análises, se empregaram as bibliotecas de Python, pandas, numpy, basemap, matplotlib e a ferramenta de cartografia QGis.
5 – Big Data Fighting Zika
A equipe “Fighting Zika”, composta por três analistas de dados da universidade PUC-Rio, trabalhou com o objetivo de prever os casos de Zika com 15 dias de antecedência. Desta maneira, se buscou melhorar a capacidade de resposta do Ministério da Saúde para destinar os recursos de maneira eficiente e aumentar os trabalhos de prevenção nas zonas adequadas. Para isso, a equipe se apoiou em Pentaho Data Integration para a manipulação de dados e em Python com as bibliotecas sklearn, ElasticNet Lasso e RidgeRegression SVR para o desenho do modelo preditivo. Finalmente, também fizeram uma visualização de seus resultados com Tableau.
Estes foram os cinco projetos que surgiram depois de fim de semana em que exploramos a capacidade que o “Big Data” tem para melhorar vidas.
———————————————————————————————————————
*Antonio Moneo é Associado Sênior em Aprendizagem e Gestão do Conhecimento no Banco Interamericano de Desenvolvimento
*Michelle Marshall é Consultora da Divisão de Proteção Social e Saúde e da divisão de Gestão do Conhecimento do Banco Interamericano de Desenvolvimento
*José Luis Delgado é Consultor de Projetos Digitais na Divisão de Gestão do Conhecimento do Banco Interamericano de Desenvolvimento
Leave a Reply