Banco Interamericano de Desarrollo
facebook
twitter
youtube
linkedin
instagram
Abierto al públicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoIndustrias CreativasLa Maleta AbiertaMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente¿Y si hablamos de igualdad?Inicio
Administración pública Agua y saneamiento Ciencia, tecnología e innovación Comercio e integración regional Conocimeinto Abierto Desarrollo infantil temprano Desarrollo urbano y vivienda Educación Energía Género y diversidad Impacto Industrias Creativas Medio ambiente, cambio climático y Salvaguardias Política y gestión fiscal Salud Sin Miedos Trabajo y pensiones
  • Skip to main content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Gente Saludable

IDB

  • INICIO
  • CATEGORÍAS
    • Envejecimiento y dependencia
    • Priorización del gasto y financiamiento
    • Salud de la mujer y la niñez
    • Salud pública y nutrición
    • Seminarios y cursos
    • Servicios de salud
    • Transformación digital
    • Vida saludable
  • autores
  • Español
    • Inglés
    • Portugués

Por qué necesitamos una revolución estadística

July 20, 2015 por Autor invitado 4 Comentarios


Por Mark van der Laan.  

Mi padre me dijo una vez que lo más importante a la hora de resolver un problema es planteárselo de manera correcta. Como estadísticos, se podría creer que la mayoría de nosotros estaría de acuerdo con este consejo. Supongamos que vamos a construir una máquina que pudiera realizar transplantes de corazón gracias a la transportación. No se necesitaría cirugía, simplemente habría que presionar un botón y la máquina por sí sola le sacaría al paciente el corazón que ya no le funciona bien y le transplantaría el nuevo  con toda la precisión necesaria que requiere llevar a cabo esta actividad. Sería algo estupendo, ¿verdad?

Sin embargo, sería realmente un disparate llevar a cabo esta operación basándonos en supuestos simplificadores cuando la ciencia nos dice que son falsos. Utilizar supuestos de este tipo podrían significar la muerte del enfermo y el fracaso del equipo medico.

Sin embargo, esta es la metodología que por lo general emplean los estadísticos, haciendo referencia, a veces, al gran estadístico inglés del siglo XX, George E.P. Box, quien creía que “en esencia, todos los modelos son falsos, pero algunos son útiles“.

Comprender por qué la afirmación del Sr. Box es obsoleta para la estadística es comprender que se están sentando las bases para una revolución en el método, para emplear uno en el que se apliquen técnicas de aprendizaje automático. Algo que parecería impensable para Box hace tres decenios y, más aún, para el precursor de la informática, Alan Turing.

Es una revolución que tiene la capacidad de fortalecer el vínculo entre científicos y estadísticos y que cumple un rol fundamental en la comprensión de macrodatos, o Big Data como se los denomina en inglés; así como los macrodatos son fundamentales para el futuro de la estadística y la ciencia. De todas maneras, para llegar a abordar lo que he denominado “targeted learning” (aprendizaje focalizado), es necesario comenzar con el problema básico del modelo estadístico.

La mayoría de las herramientas de software de estadística fomentan el uso del modelo paramétrico. Por esto, el diseño y análisis de experimentos se basa en supuestos muy simplificadores acerca de la distribución de datos que están bastante errados.

Muchos han admitido que estos modelos de análisis obtienen como resultado una epidemia de falsos positivos, es decir, conclusiones falsas. Entre ellos, se encuentra John Ioannidis, quien, en el año 2005, publicó en la revista médica internacional PLOS Medicine el artículo titulado: “¿Por qué la mayoría de las investigaciones son falsas?”. Este ensayo proporcionó argumentos convincentes para una reforma y atrajo la atención de muchas personas fuera del ámbito de la ciencia y la estadística a un problema que es de gran importancia para la producción de conocimiento.

Se puede demostrar, entonces, que el empleo de modelos paramétricos garantizados no específicos también es garantía de que, para un tamaño de muestra lo suficientemente grande, el intervalo de confianza declarado no incluirá el valor real, por ejemplo, la verdadera magnitud de los efectos de un tratamiento para una enfermedad del corazón.

Esto significa que nosotros, los estadísticos, nos enorgullecemos por ir más allá de la extracción de datos, cuando en realidad nuestros intervalos de confianza son siempre erróneos.

Aprendizaje focalizado y macrodatos Por otra parte, hemos llegado a un momento en la historia en el que la tecnología puede ayudarnos a trascender las restricciones que nos impone el modelo paramétrico y a enfrentar los problemas que surgen de la estimación de parámetros. Así, lograr un modelo estadístico realista y una definición clara del valor  real deseado, que son la respuesta a la cuestión.

Desde el año 2006, hemos desarrollado un método estadístico de aprendizaje, enfocado a un máximo de probabilidades, que integra el estado actual del aprendizaje automático y la estimación de datos adaptativos  a los increíbles avances tecnológicos en inferencias causales, datos censurados, eficacia y teorías del proceso empírico. La integración del aprendizaje automático se efectúa a través de lo que hemos denominado “super learning” (macro aprendizaje).  Al presentar un alto grado de flexibilidad con respecto al conjunto de datos y al orientar el aprendizaje hacia el valor real deseado, el targeted learning nos permite proporcionar un valor estimado y un intervalo de confianza preciso.

El primer paso en el super learning es la construcción de una biblioteca que incluya estimadores basados en un modelo paramétrico y estimadores de datos flexibles. Existen numerosos algoritmos de aprendizaje automático y es un número que crece cada año. Los algoritmos atraviesan un proceso iterativo de actualización que tiene como finalidad alcanzar un equilibrio entre el sesgo (que tiene lugar cuando el modelo no es lo suficientemente flexible) y la varianza (cuando el modelo es demasiado flexible).

El algoritmo de super learning utiliza los datos para decidir entre todas las combinaciones ponderadas posibles de estos algoritmos. El conjunto de datos se pueden subdividir en varias “muestras de entrenamiento”, en donde los algoritmos compiten entre sí, y en “muestras de validación”, en donde se evalúa el rendimiento de los mismos. La combinación ponderada que ofrezca el mejor de rendimiento promedio es la elegida.

Nuestra investigación ha demostrado que para el análisis de grandes muestras de datos, el proceso de super learner posee un rendimiento igual al de la mejor combinación ponderada de todos estos algoritmos. Por lo tanto, lo que hemos aprendido es que no se debe apostar por un solo algoritmo, sino que se debería usar cada uno de ellos para crear una biblioteca fuerte que contenga una diversa gama de algoritmos candidatos y luego, implementarlos sobre el conjunto de datos de manera competitiva.

Este campo de targeted learning está abierto a todo tipo de contribuciones. Lo cierto es que toda persona que se plantee con honestidad el problema de la estimación de parámetros, y que esté realmente interesada en encontrar una respuesta a esta cuestión científica se verá, en cierta forma, obligada a informarse acerca de estos métodos y podrá realizar contribuciones importantes en esta área.

En conclusión, la ciencia necesita los macrodatos y un targeted learning estadístico, por lo que estadísticos y científicos de datos deberán ponerse a la altura de los desafíos para que la ciencia prospere en su totalidad.

Mark van der Laan es profesor de bioestadística y estadística de la Universidad de Berkeley, California.Su grupo de investigación es responsable de desarrollar los enfoques estadísticos de aprendizaje dirigido.


Archivado bajo:Transformación digital Etiquetado con:Banco Interamericano de Desarrollo, BID, ciencia, estadística, investigación, medicina, Salud

Autor invitado

Reader Interactions

Comments

  1. Hector Hurtado dice

    July 22, 2015 at 8:59 am

    Leí el artículo y aún me cuesta entenderlo. Faltó ejemplos que ilustren las tesis planteadas. Lo pueden realizar en una siguiente publicación.

    Reply
  2. Fulvia Guerra dice

    July 23, 2015 at 9:44 am

    Interesante, los comentarios espero mayores publicaciones de este autor para comprenderlos mejor.

    Reply
  3. Erick dice

    July 29, 2015 at 5:12 pm

    Como indican en los comentarios anteriores, sería de gran utilidad para comprender mejor los conceptos ejemplos. Quizás otro artículo solo para ilustrar el ejemplo. Es una lectura que requieres de conceptos previos (términos estadísticos), no es para todo público.

    Reply
  4. Emma Flores dice

    July 30, 2015 at 9:45 am

    Buen aporte, al leer este artículo me di cuenta del error que cometí al ejecutar mi trabajo de investigación…

    Reply

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Primary Sidebar

SIGUENOS

Subscribe

Buscar

Salud

Los países de América Latina y el Caribe se enfrentan a grandes retos para garantizar la salud de sus ciudadanos. En este blog, los especialistas del BID y expertos internacionales exploran temas de actualidad sobre la salud y buscan, a través de tus comentarios, un diálogo enriquecedor.

Latin American and Caribbean countries face multiple challenges to provide quality healthcare for their citizens. In this blog, IDB Specialists and international experts discuss current health issues and hope to build a dynamic dialogue through your comments.

Artículos relacionados

  • Netflix, Amazon y las políticas públicas en salud
  • DIABETIMSS: Novedoso estudio usa aprendizaje automático para mejorar el tratamiento de diabetes en México.
  • Mi algoritmo es mejor que el tuyo
  • Y si el algoritmo en salud se equivoca, ¿a quién reclamo?
  • Las herramientas digitales pueden prevenir recetas de medicamentos inapropiados e incluso peligrosos

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube
youtube

    Blogs escritos por empleados del BID:

    Copyright © Banco Interamericano de Desarrollo ("BID"). Este trabajo está disponible bajo los términos de una licencia Creative Commons IGO 3.0 Reconocimiento-No comercial-Sin Obras Derivadas. (CC-IGO 3.0 BY-NC-ND) y pueden reproducirse con la debida atribución al BID y para cualquier uso no comercial. No se permite ningún trabajo derivado. Cualquier disputa relacionada con el uso de las obras del BID que no se pueda resolver de manera amistosa se someterá a arbitraje de conformidad con el reglamento de la CNUDMI. El uso del nombre del BID para cualquier otro propósito que no sea la atribución, y el uso del logotipo del BID estarán sujetos a un acuerdo de licencia escrito por separado entre el BID y el usuario y no está autorizado como parte de esta licencia CC-IGO. Tenga en cuenta que el enlace proporcionado anteriormente incluye términos y condiciones adicionales de la licencia.


    Blogs escritos por autores externos:

    Para preguntas relacionadas con los derechos de autor para autores que no son empleados del BID, por favor complete el formulario de contacto de este blog.

    Las opiniones expresadas en este blog son las de los autores y no necesariamente reflejan las opiniones del BID, su Directorio Ejecutivo o los países que representan.

    Atribución: además de otorgar la atribución al respectivo autor y propietario de los derechos de autor, según proceda, le agradeceríamos que incluyera un enlace que remita al sitio web de los blogs del BID.



    Política de privacidad

    Derechos de autor © 2025 · Magazine Pro en Genesis Framework · WordPress · Log in

    Banco Interamericano de Desarrollo

    Aviso Legal

    Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

    facebook
    twitter
    youtube
    En este sitio web se utilizan cookies para optimizar la funcionalidad y brindar la mejor experiencia posible. Si continúa visitando otras páginas, se instalarán cookies en su navegador.
    Para obtener más información al respecto, haga clic aquí.
    X
    Manage consent

    Privacy Overview

    This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
    Necessary
    Always Enabled
    Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
    Non-necessary
    Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
    SAVE & ACCEPT