Banco Interamericano de Desarrollo
facebook
twitter
youtube
linkedin
instagram
Abierto al públicoBeyond BordersCaribbean Development TrendsCiudades SosteniblesEnergía para el FuturoEnfoque EducaciónFactor TrabajoGente SaludableGestión fiscalGobernarteIdeas MatterIdeas que CuentanIdeaçãoImpactoIndustrias CreativasLa Maleta AbiertaMoviliblogMás Allá de las FronterasNegocios SosteniblesPrimeros PasosPuntos sobre la iSeguridad CiudadanaSostenibilidadVolvamos a la fuente¿Y si hablamos de igualdad?Inicio
Administración pública Agua y saneamiento Ciencia, tecnología e innovación Comercio e integración regional Conocimeinto Abierto Desarrollo infantil temprano Desarrollo urbano y vivienda Educación Energía Género y diversidad Impacto Industrias Creativas Medio ambiente, cambio climático y Salvaguardias Política y gestión fiscal Salud Sin Miedos Trabajo y pensiones
  • Skip to main content
  • Skip to secondary menu
  • Skip to primary sidebar
  • Skip to footer

Abierto al público

  • INICIO
    • ¿Qué es el Conocimiento Abierto?
    • Sobre este blog
    • ¿Cómo suscribirse?
    • Pautas editoriales
  • CATEGORÍAS
    • Aprendizaje abierto
    • Código abierto
    • Datos abiertos
    • Gestión del conocimiento
    • Sistemas abiertos
  • AUTORES
  • Español

El crowdsourcing pone la ciencia de datos al alcance de todos

January 17, 2017 por Deja un comentario


La ciencia de datos, mejor conocida como “data science” se ha convertido en una de las disciplinas con mayor crecimiento en las empresas e instituciones de investigación dada a la versatilidad de soluciones que puede ofrecer en las diferentes industrias. Muchas veces sin que el usuario esté consciente, grandes cantidades de datos son procesados para recomendar una película, predecir el precio de un vuelo o clasificar una compra como fraudulenta o legítima.

Sin embargo, el proceso de analizar datos es caro, complicado e imperfecto, ya que la ciencia de datos involucra muchas disciplinas diferentes, además, no hay una receta para el “modelo perfecto”.  A diferencia del desarrollo de software, que se tiene claro el resultado final, un proceso analítico puede arrojar resultados inesperados y en ocasiones no se llega a una solución viable. La ciencia de datos es una ciencia inexacta.

A continuación, exploraremos un breve recuento del desarrollo de esta ciencia y cómo se ha ido volviendo más accesible:

1 Historia de la ciencia de datos 

En el siguiente gráfico, se muestra la tendencia y resultados de búsqueda de tres ocupaciones (estadístico, ingeniero en software y científico de datos) en los últimos 10 años. En la primera mitad de ese periodo, “Data Scientist” prácticamente no generaba búsquedas, mientras que en la segunda mitad la tendencia va hacia la alta incluso superando a las demás profesiones en los últimos años. 

crowdsourcing-ciencia-datos-1
Tendencia de búsqueda de “Estadístico”, “Ingeniero de Software” y “Científico de Datos” en Google Noviembre 2006-Noviembre 2016. Fuente: Google Trends.

La ciencia de datos es una disciplina relativamente nueva, en 1977 apenas se estaba hablando de que “debía hacerse más énfasis en el uso de datos para sugerir hipótesis”. No fue hasta 1996 que se acuñaron términos como “data science” (ciencia de datos) o “data mining” (minería de datos) como “la aplicación de algoritmos específicos para extraer patrones de datos”.

 

2 La evolución del crowdsourcing

La “novedosa” necesidad de profesionales multidisciplinarios diestros en la ciencia de datos representa un reto para las empresas y organizaciones, así como una oportunidad para los jóvenes profesionales que quieren incursionar en el análisis de datos. Como resultado de esto nació el “crowdsourcing”, es decir, la acción de abrir una convocatoria para que un grupo de personas alrededor del mundo solucione un problema o tarea de manera colaborativa. Actualmente, los ejemplos de su uso abundan: Wikipedia, hackatones, concursos de diseño gráfico, robótica, emprendedurismo y sobre casi cualquier tema que se pueda abrir a la población para que ésta busque o desarrolle su solución. Como resultado, se obtienen no solo las ideas de un equipo contratado para realizar cierta tarea, sino la combinación de conocimiento que un grupo grande de personas puede aportar.

Bajo este paradigma nacen las competencias de ciencia de datos. El sitio más famoso que las organiza se llama kaggle. A través de este sitio web, compañías u organizaciones ponen a disposición un problema y un set de datos de prueba a más de 85.000 científicos de datos alrededor del mundo y éstos se encargan de solucionarlo con la promesa de una recompensa. Los premios en kaggle varían desde una suma económica, trabajos en la empresa que propone el problema, o simplemente el reconocimiento.

3 La ciencia de datos y el crowdsourcing promoviendo la inclusión 

La ventaja de este “modelo” es que no hay barreras de entrada. Cualquiera con una cuenta en kaggle puede colaborar, enviar propuestas y participar en los foros para ampliar la base de conocimientos general. Así mismo, muchas empresas y organizaciones pueden verse beneficiadas: 55 competencias en kaggle han sido dedicadas para investigaciones tales como identificar ballenas en peligro de extinción, pacientes con epilepsia o rehabilitación de personas con extremidades amputadas.

Este modelo permite además a las instituciones concentrarse en un problema, con la ayuda de iniciativas como kaggle, pueden darle valor a sus datos mediante un proceso estructurado para asegurar que los científicos de datos tengan todos los insumos que necesitan para resolver el problema solicitado. El reto más grande de muchas organizaciones no es que no puedan pagar un equipo de ciencia de datos, probablemente sí puedan, pero sus estructuras organizacionales y tecnológicas aún no se adaptan a una arquitectura de datos centralizada y organizada, ideal y lista para arrojar preguntas y crear modelos para responderlas.

Tal vez sea muy difícil y caro crear una base de conocimiento tan amplia como Wikipedia o Stack Overflow de manera privada o tener a disposición los mejores profesionales en los equipos de trabajo, pero gracias al crowdsourcing precisamente esto es posible. Literalmente, millones de cabezas piensan mejor que una.

Por: Eladio Montero de Grupo Inco


Archivado Bajo:Datos abiertos Etiquetado con:Análisis de datos, Crowdsourcing

Reader Interactions

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Primary Sidebar

SÍGUENOS

Suscríbete

Sobre este blog

Podemos describir al conocimiento abierto como aquel conocimiento que puede ser usado, reutilizado y compartido sin restricciones, ya que cuenta con las características tanto legales como tecnológicas para ser accedido por cualquier persona, en cualquier momento y en cualquier lugar del mundo.

En el blog 'Abierto al Público' exploramos los temas, recursos, iniciativas e impacto de la apertura de conocimiento a nivel global, prestando especial atención a lo que sucede en la región de América Latina y el Caribe. También abordamos los esfuerzos que lleva a cabo el Banco Interamericano de Desarrollo por apoyar la diseminación del conocimiento abierto y accionable que constantemente genera esta organización.

Buscar

Temas

AcademiaBID Acceso abierto Acceso a la información Análisis de datos Análisis de texto Big Data Cambio climático Ciencia Abierta Conceptos clave Conocimiento Abierto Coronavirus Creative Commons Credenciales digitales Crowdsourcing Código para el Desarrollo Datos geoespaciales Diseño instruccional El Rincón de Publicación Emprendimiento Eventos Gobierno abierto Género y diversidad Hackatones Inclusión digital Innovación abierta Inteligencia Artificial Lecciones aprendidas Metodologías MOOC Más leídos Números para el Desarrollo Objetivos de Desarrollo Sostenible Participación ciudadana Paso a paso Periodismo de datos Procesamiento del Lenguaje Natural Productos de conocimiento Protección de datos Proyectos de desarrollo Recursos accionables Solidaridad Taxonomía Trabajo en equipo Visualización de datos

Publicaciones similares

  • Celebramos el Día de los Datos Abiertos 2022
  • Tratemos las bases de datos como si fueran artículos científicos
  • ¡Colabora en el mapeo de competencias de datos abiertos en América Latina y el Caribe!
  • Análisis de datos para detectar un problema en el rendimiento de la educación secundaria
  • Crowdsourcing: definición, tipos y su importancia para el desarrollo

Footer

Banco Interamericano de Desarrollo
facebook
twitter
youtube
youtube
youtube

    Blogs escritos por empleados del BID:

    Copyright © Banco Interamericano de Desarrollo ("BID"). Este trabajo está disponible bajo los términos de una licencia Creative Commons IGO 3.0 Reconocimiento-No comercial-Sin Obras Derivadas. (CC-IGO 3.0 BY-NC-ND) y pueden reproducirse con la debida atribución al BID y para cualquier uso no comercial. No se permite ningún trabajo derivado. Cualquier disputa relacionada con el uso de las obras del BID que no se pueda resolver de manera amistosa se someterá a arbitraje de conformidad con el reglamento de la CNUDMI. El uso del nombre del BID para cualquier otro propósito que no sea la atribución, y el uso del logotipo del BID estarán sujetos a un acuerdo de licencia escrito por separado entre el BID y el usuario y no está autorizado como parte de esta licencia CC-IGO. Tenga en cuenta que el enlace proporcionado anteriormente incluye términos y condiciones adicionales de la licencia.


    Blogs escritos por autores externos:

    Para preguntas relacionadas con los derechos de autor para autores que no son empleados del BID, por favor complete el formulario de contacto de este blog.

    Las opiniones expresadas en este blog son las de los autores y no necesariamente reflejan las opiniones del BID, su Directorio Ejecutivo o los países que representan.

    Atribución: además de otorgar la atribución al respectivo autor y propietario de los derechos de autor, según proceda, le agradeceríamos que incluyera un enlace que remita al sitio web de los blogs del BID.



    Política de privacidad

    Copyright © 2025 · Magazine Pro on Genesis Framework · WordPress · Log in

    Banco Interamericano de Desarrollo

    Aviso Legal

    Las opiniones expresadas en estos blogs son las de los autores y no necesariamente reflejan las opiniones del Banco Interamericano de Desarrollo, sus directivas, la Asamblea de Gobernadores o sus países miembros.

    facebook
    twitter
    youtube
    En este sitio web se utilizan cookies para optimizar la funcionalidad y brindar la mejor experiencia posible. Si continúa visitando otras páginas, se instalarán cookies en su navegador.
    Para obtener más información al respecto, haga clic aquí.
    x
    Manage consent

    Privacy Overview

    This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
    Necessary
    Always Enabled
    Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
    Non-necessary
    Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
    SAVE & ACCEPT