Por Rose E. Wang y Megha Srivastava
Paseando por el edificio de ciencias de la computación de Stanford, podemos ver ChatGPT en casi todas las pantallas. Hoy en día, los estudiantes pueden usar la Inteligencia Artificial (IA) en cada etapa de su proceso de aprendizaje. Por ejemplo, en lugar de empezar una tarea de programación desde cero, los estudiantes pueden simplemente copiar y pegar la pregunta en un modelo de IA y pedirle sugerencias. Incluso si la solución no funciona perfectamente de inmediato, pueden volver a pedir al modelo su propia solución y una descripción del error para recibir una nueva solución ya corregida.
No podemos evitar la tentación de comparar esta forma de aprender, con ayuda de la IA, con nuestras propias experiencias en la universidad cuando aprendimos a programar. Para nosotros fue particularmente desafiante escribir esas primeras líneas de código. También recordamos los días que pasábamos trabajando con nuestros amigos en la universidad y la sensación de éxito después de una noche sin dormir, cuando finalmente arreglamos el error. No nos gustaba quedarnos atascados en el momento. Pero ahora, mirando hacia atrás, entendemos lo importante que fue para nuestro aprendizaje superar esos obstáculos. Nuestros esfuerzos no solo fueron productivos en cuanto a encontrar la solución correcta a corto plazo, sino también para poder escribir código y programas más robustos y menos propensos a errores a largo plazo.

Figura 1: El esfuerzo productivo para superar desafíos es importante para el aprendizaje humano. ¿Nos hemos vuelto demasiado dependientes de ChatGPT?
Es innegable. Los sistemas de IA como ChatGPT son fascinantes, pero también representan un desafío importante a la esencia misma de cómo aprendemos. Estos sistemas se destacan en tareas que requieren años de formación, práctica y experiencia para poderlas dominar, como por ejemplo matemáticas avanzadas o programación. Los sistemas también están volviéndose más accesibles, y pueden ser utilizados en cuanto que una tarea nos resulte ligeramente difícil. A pesar del avance de la IA, las habilidades fundacionales en niños y adultos están disminuyendo, lo que plantea la pregunta: ¿qué aspectos del aprendizaje queremos que la tecnología fomente?
Necesitamos esforzarnos para desarrollar nuevas habilidades. Por “esfuerzo productivo”, nos referimos al tiempo y concentración que los estudiantes invierten en comprender un concepto y trabajar mediante desafíos para descubrir soluciones que no son inmediatamente obvias. Aunque no disfrutemos de los desafíos del aprendizaje, este esfuerzo nos enseña a ser perseverantes y profundiza nuestra comprensión. Nuestra preocupación es que, con la IA, podríamos desarrollar el hábito de evitar este esfuerzo, y ese hábito podría erosionar nuestro conocimiento.
¿Cómo podemos preservar un aprendizaje significativo en un mundo donde las respuestas están a solo un mensaje de distancia?
La paradoja de la evaluación
Nuestros paradigmas tradicionales para evaluar sistemas de IA a menudo dependen de las calificaciones de satisfacción del usuario o de evaluaciones de referencia, métricas que la investigación ha demostrado insuficientes para la educación. Por ejemplo, Hiroko Warshauer y James Hiebert demostraron que un apoyo efectivo para el esfuerzo productivo en entornos pedagógicos requiere atención a múltiples dimensiones, como la naturaleza del lenguaje de un maestro, el diseño de las tareas y el entorno de aprendizaje en general. Además, los estudios de Arthur Glenberg y Michael Pressley y otros coautores, han mostrado que los estudiantes a menudo sobrestiman su propio entendimiento y pueden preferir sistemas que reduzcan los desafíos a corto plazo. ¿Cómo se refleja esta paradoja entre la preferencia del usuario y su aprendizaje en nuestros sistemas actuales de IA?
En nuestro trabajo sobre la evaluación de interacciones entre humanos y sistemas de IA —en este caso, modelos de lenguaje— para tareas de búsqueda de información como responder preguntas, también observamos una desconexión entre la percepción de utilidad de los usuarios y el rendimiento real de los modelos en el desempeño de la tarea específica: los modelos de lenguaje que los usuarios reportaron como útiles no siempre fueron los más precisos (Ver la figura 2).
Este resultado se atribuyó a que los usuarios depositaron una confianza indebida en el lenguaje “seguro” y “definitivo” generado por ciertos modelos de lenguaje, particularmente aquellos con ajuste adicional. Solo cuando estos usuarios se encontraron con una respuesta que sonaba segura pero evidentemente incorrecta, su evaluación del modelo de lenguaje disminuyó rápidamente. Por otro lado, algunos usuarios que trabajaban con modelos de lenguaje que proporcionaban respuestas indirectas y más largas confiaban en que el esfuerzo que les requería era intencional y tenía valor, incluida una participante que afirmó “¡la tarea no sería tan divertida si la IA te diera todas las respuestas!”


Figura 2: Pedimos a los usuarios que respondieran preguntas de química de la Universidad de la base de datos MMLU mientras tenían acceso a diferentes modelos de lenguaje (LM) para ayudar. Aquellos que interactuaron con LMs más fuertes (por ejemplo, modelos ajustados para instrucciones) recibieron respuestas más directas y confiadas que aquellos que interactuaron con LMs más débiles, incluso en presencia de alucinaciones. Esto resultó en una discrepancia entre la utilidad reportada por el usuario y el rendimiento de la tarea, lo que sugiere que una dependencia excesiva puede obstaculizar el aprendizaje.
Si las autoevaluaciones y el compromiso reportados por los estudiantes no reflejan necesariamente el aprendizaje, ¿cómo debe verse una buena enseñanza cuando los estudiantes están realmente esforzándose? ¿Podemos usar la IA para orientar a los maestros para que propicien el l esfuerzo productivo de sus estudiantes?
Fomentando el esfuerzo productivo empoderando a los maestros
Si bien muchas personas pueden ser maestros, desde padres, mentores, tutores hasta maestros tradicionales, los buenos maestros son difíciles de encontrar. Los buenos maestros adquieren su experiencia durante años de entrenamiento, practica, experiencia, prueba y error, y los estudiantes que más necesitan maestros experimentados a menudo tienen menos acceso a ellos. Esta inequidad impacta la calidad de su educación y su exposición al esfuerzo productivo.
Una dirección prometedora es usar la IA para ayudar a los educadores a crear mejores oportunidades de esfuerzo productivo para sus estudiantes. En investigaciones anteriores, observamos que los educadores novatos tienen dificultades para ayudar a los estudiantes que encuentran dificultades de aprendizaje, particularmente cuando están bajo presión de tiempo. Estos educadores no estaban seguros de cómo guiar a los estudiantes ni de qué decir en el momento. Sin una guía sobre cómo fomentar efectivamente el esfuerzo productivo, a menudo recurrían a proporcionar directamente la solución al estudiante. ¡Esto significaba perder oportunidades para convertir el desafío de comprensión de un estudiante en un aprendizaje significativo por medio del esfuerzo productivo!
Para abordar esto, desarrollamos Tutor CoPilot, un sistema impulsado por IA diseñado para proporcionar sugerencias en tiempo real a los tutores humanos sobre cómo fomentar el esfuerzo productivo (Figura 3). Tutor CoPilot es un modelo de lenguaje que genera sugerencias similares a las de un experto sobre cómo estructurar el aprendizaje del estudiante, como hacer una pregunta guía o proporcionar una pista. A diferencia de herramientas genéricas como ChatGPT, que corren el riesgo de proporcionar la respuesta al estudiante o pueden no ser capaces de mantener la atención de estudiante durante toda una hora de aprendizaje, Tutor CoPilot se enfoca en amplificar la capacidad del tutor para fomentar el esfuerzo productivo.

Figura 3: Ilustración de Tutor CoPilot. Tutor CoPilot proporciona sugerencias en tiempo real para los tutores sobre cómo ayudar a los estudiantes que enfrentan desafíos. Estas sugerencias siguen estrategias informadas por expertos, como hacer una pregunta guía o proporcionar una pista.
Probamos Tutor CoPilot para proporcionar orientación a los tutores en una evaluación de impacto aleatorizada y encontramos que la tecnología mejoró el rendimiento de los estudiantes en pruebas de matemáticas (Figura 4, izquierda). Pero¿qué cambió realmente en la instrucción del tutor para propiciar que los estudiantes aprendieran? ¿Estaban los tutores fomentando efectivamente el esfuerzo productivo? Cuando analizamos todo el lenguaje de los tutores, encontramos que los tutores que tuvieron acceso a Tutor CoPilot estaban utilizando un lenguaje que estructuraba mejor el aprendizaje y fomentaba el esfuerzo productivo, por ejemplo, pidiendo a los estudiantes que explicaran sus respuestas (Figura 4, derecha). Los tutores que no tenían acceso a Tutor CoPilot daban más a menudo la respuesta correcta que una estrategia para llegar a la solución correcta. Al mejorar cómo los tutores fomentan el esfuerzo productivo, los estudiantes aprendieron mejor como resultado.

Figura 4: Resultados de Tutor CoPilot. (Izquierda) Encontramos que los estudiantes que trabajaron con tutores que tenían acceso a Tutor CoPilot tenían un 4% más de probabilidades de aprobar sus pruebas de lecciones de matemáticas. (Derecha) Los tutores con acceso a Tutor CoPilot usaron estrategias que fomentan mejor el esfuerzo productivo, mientras que los tutores que no tenían acceso daban las respuestas correctas y apoyo genérico a los estudiantes.
Existen otros enfoques interesantes y prometedores que nos invitan a replantear el papel de la IA en el trabajo cotidiano de los maestros y otros educadores. Por ejemplo, trabajos de CU Boulder exploran cómo la IA puede ayudar a los estudiantes a colaborar mejor con sus compañeros al establecer acuerdos comunitarios. El trabajo de Amplify aprovecha la tecnología para hacer que el aprendizaje en el aula sea más social al permitir que los estudiantes prueben diferentes ideas, compartan sus observaciones matemáticas y tengan discusiones más significativas en clase. Estos ejemplos ilustran cómo podemos apoyar el aprendizaje invitando a la curiosidad estudiantil y empoderando las relaciones humanas entre estudiantes y educadores a través de la tecnología.
En su esencia, el aprendizaje es mucho más que encontrar la respuesta correcta: se trata de construir resiliencia, fomentar la curiosidad y enriquecer el viaje del descubrimiento para los estudiantes. A pesar de los avances increíbles en la tecnología como la IA, las habilidades humanas, desde la alfabetización hasta las habilidades motoras finas, siguen disminuyendo, y algunos culpan el aumento del tiempo frente a las pantallas y la dependencia de la tecnología. En una era donde la IA puede ofrecer soluciones instantáneas y gratificación, debemos reconsiderar cómo preservar activamente los aspectos esenciales del aprendizaje.
Conclusión
Creemos que el papel de la IA en la educación no es eliminar esfuerzo, sino mejorarlo. Ya sea empoderando a los educadores con herramientas como Tutor CoPilot, o empoderando a los estudiantes con entornos que fomenten la investigación independiente, queremos asegurarnos de que la IA apoye experiencias de aprendizaje más profundas y significativas. ¡Construyamos un futuro donde los sistemas de IA fomenten —y no disminuyan— el aprendizaje significativo desde el principio!
Nota: Esta artículo se publicó originalmente en The Stanford AI Lab Blog el 29 de enero de 2025 y se vuelve a publicar con el permiso de las autoras. Si quieres leer otros blogs que hemos publicado sobre IA haz click acá. Estén atentos a esta serie de Enfoque EducAIción, a nuestras redes sociales y a nuestro boletín de prensa para mantenerse al tanto de esta conversación y no dejen de compartir con nosotros sus preguntas, comentarios e ideas sobre esta realidad en constante evolución.