La relevancia de los datos masivos sigue creciendo más y más en nuestras vidas. Para que cada vez estos conceptos te sean más fácil de entender y los puedas utilizar en tu trabajo, el BID y Telefónica han desarrollado el MOOC “Big Data Sin Misterios.” El curso te acercará a varios conceptos y técnicas del campo de estudios de los datos masivos y el aprendizaje de máquinas, también conocido en inglés como machine learning. Una de las técnicas de procesamiento de los datos masivos que se enseña en el curso es el aprendizaje profundo.
El aprendizaje profundo es una herramienta de la inteligencia artificial que es relevante al desarrollo de soluciones tecnológicas muy poderosas. En este artículo, vamos a explorar esta técnica para empezar a quitarle el misterio y mostrar alguno de los temas que puedes seguir aprendiendo a través del curso “Big Data Sin Misterios.”
Desde el aprendizaje automático al aprendizaje profundo
¿Te acuerdas de cómo aprendiste a comunicarte? Fuiste escuchando o viendo las mismas palabras muchas veces y formaste patrones, para aprender a identificar palabras y conectar conceptos, hasta saber cómo generar una respuesta.
Las computadoras aprenden de manera parecida. Los chatbots como Cortana y los asistentes virtuales como Alexa son capaces de “entender” nuestras preguntas y generar respuestas relevantes gracias al procesamiento de altos volúmenes de datos, que sean datos de texto o grabaciones de voz. El asistente virtual es entrenado por medio de algoritmos que le exponen a millones y millones de ejemplos en la pronunciación de cada palabra. Cuando hablamos sobre el machine learning o el aprendizaje automático, en general se refiere a este proceso de “entrenamiento” con datos.
El rol de las redes neuronales
Nosotros como humanos tenemos un cerebro que nos facilita este proceso de aprendizaje, sin que nos demos cuenta. En cambio, las máquinas dependen de ciertos algoritmos para guiarles en los procesos de aprendizaje, las reglas que utilizan para repasar y hacer sentido de todos los datos que se enseñan. Podemos decir que el engranaje más importante del aprendizaje profundo son las redes neuronales, una implementación automatizada del análisis estadístico. El “misterio” detrás de las redes neuronales es pura estadística y teoría de la probabilidad clásicas: regresiones no-lineales, y clasificación bayesiana, para nombrar algunas, ciencia generada desde el siglo XVII. Lo que las redes neuronales hacen es procesar iterativamente grandes volúmenes de datos cambiando la ponderación de dichas fórmulas, con una capacidad automática enorme. Algo que un estadista podría hacer a mano con horas y horas de trabajo durante años, es realizado por un computador en milésimas de segundo.
Aplicaciones que mejoran vidas
Dada su complejidad y lo “pesado” (en términos de bytes) de procesar medios como las imágenes y los sonidos, no se había podido avanzar en el uso de algoritmos para procesar este material hasta hace relativamente poco tiempo. Sin embargo, el aprendizaje profundo ha logrado cambiar radicalmente esta realidad al poderse procesar estos datos a altísimos volúmenes y rapidez, así evolucionando el reconocimiento de imágenes, audio y video para tareas de inteligencia artificial. Los algoritmos de aprendizaje profundo logran segmentar tanto imágenes como piezas de audio en sus componentes más mínimos (como pixeles). Éstos se procesan iterativamente en varias rondas, cada una mejorando la capacidad de la máquina de reconocer una materia semejante a la que “vio” o “escuchó” anteriormente.
Como ejemplo, el Hospital de Oncología María de Dios en Porto Alegre[1] está utilizando tecnología de Watson-IBM para procesar grandes volúmenes de texto e imágenes en historias clínicas de pacientes para sugerir tratamientos personalizados conforme cada caso en particular.
El aprendizaje profundo es solamente una herramienta entre muchas que tienen que ver con los datos masivos. ¡Inscríbete ya mismo al curso “Big Data sin Misterios” para desvelar esta y otras tecnologías que están revolucionando el mundo!
Por Norma Palomino, Jefa de la Unidad de Servicios de Información del Sector de Conocimiento, Innovación y Comunicación del BID
[1] https://www.maededeus.com.br/PortalMedico/Noticia/143/hospital-do-cancer-mae-de-deus-e-o-1o-da-america-do-sul-a-utilizar-o-watson-for-oncology
Ana María García Dice
Expertos del BID, necesitaria saber cuando comienza el curso y las condiciones.
Muchas gracias.
Saludos.
Guillen Concepcion Dice
Fecha de apertura del MOOC