La IA ajusta las respuestas según la raza y el género

Barshay, Jill. “Feedback Bias? How AI Adjusts Replies Based on Race and Gender, Research Finds.” MindShift–KQED, 27 de abril de 2026. Disponible en: KQED MindShift

El artículo analiza una investigación realizada por la Stanford University que revela cómo los sistemas de inteligencia artificial utilizados para proporcionar retroalimentación educativa pueden modificar sus respuestas en función de características asociadas a la identidad de los estudiantes. El estudio pone de manifiesto que la IA no siempre actúa como una herramienta neutral, sino que puede reproducir y amplificar patrones de sesgo presentes en los datos con los que fue entrenada.

Para llevar a cabo la investigación, los autores introdujeron 600 ensayos escritos por estudiantes de secundaria en varios modelos de lenguaje. Posteriormente, enviaron los mismos textos múltiples veces, pero modificando la descripción del supuesto autor: se indicaba que era hombre o mujer, blanco, negro o hispano, estudiante motivado o desmotivado, o que tenía alguna discapacidad de aprendizaje. Aunque los ensayos eran exactamente los mismos, las respuestas generadas por la IA cambiaban de forma sistemática según la identidad atribuida al estudiante.

Los resultados mostraron que los textos atribuidos a estudiantes negros recibían más elogios, comentarios positivos y mensajes de ánimo. Con frecuencia se destacaban aspectos relacionados con el liderazgo, la experiencia personal o la capacidad de influir en otros. Por el contrario, cuando los ensayos se atribuían a estudiantes blancos, la retroalimentación tendía a centrarse más en la estructura argumentativa, la calidad de las pruebas aportadas y la claridad de las ideas. Es decir, recibían observaciones más críticas y orientadas a mejorar el razonamiento y la escritura.

El estudio también detectó diferencias vinculadas al género. Las estudiantes recibían comentarios con un tono más afectuoso y cercano, mientras que los estudiantes varones obtenían observaciones más directas y centradas en aspectos técnicos del texto. De igual modo, los alumnos etiquetados como muy motivados recibían sugerencias más exigentes para perfeccionar su trabajo, mientras que aquellos descritos como poco motivados obtenían mensajes más alentadores y menos críticos.

Los investigadores denominan a este fenómeno “sesgo de retroalimentación positiva” y “sesgo de retención de críticas”. En otras palabras, algunos grupos reciben más apoyo emocional y menos correcciones, mientras que otros reciben observaciones más rigurosas destinadas a mejorar su rendimiento. Aunque estas diferencias pueden parecer pequeñas en un único comentario, su acumulación a lo largo del tiempo podría influir en el desarrollo académico de los estudiantes y generar desigualdades en las oportunidades de aprendizaje.

La explicación propuesta por los autores es que los modelos de IA aprenden a partir de enormes cantidades de lenguaje humano, por lo que absorben patrones culturales, sociales y educativos presentes en esos datos. Así, la IA no crea los sesgos desde cero, sino que refleja y, en algunos casos, amplifica comportamientos ya observados en las interacciones humanas. Los investigadores señalan que este fenómeno es especialmente preocupante porque suele pasar desapercibido para quienes utilizan estas herramientas.

El artículo plantea además una cuestión fundamental para el futuro de la educación: ¿hasta qué punto la personalización de la enseñanza mediante IA puede convertirse en una forma de estereotipación? La personalización suele considerarse una ventaja porque adapta la enseñanza a las necesidades de cada estudiante. Sin embargo, si la adaptación se basa en expectativas diferentes según la identidad del alumno, existe el riesgo de que algunos estudiantes reciban menos oportunidades para desarrollar plenamente sus capacidades.

Los autores concluyen que las herramientas de inteligencia artificial no deberían sustituir el criterio pedagógico humano. Recomiendan que docentes y responsables educativos supervisen cuidadosamente la retroalimentación generada por la IA antes de entregarla a los estudiantes. La investigación constituye una advertencia sobre la necesidad de diseñar sistemas educativos de IA más transparentes, auditables y equitativos, capaces de ofrecer apoyo personalizado sin reproducir desigualdades sociales preexistentes.