El primer artículo redactado por una inteligencia artificial que supera la revisión por pares

Whitney Grace, “The First AI-Written Paper to Pass Peer ReviewArnoldIT, April 2, 2025, https://arnoldit.com/wordpress/2025/04/02/the-first-ai-written-paper-to-pass-peer-review/.

Sakana AI informa de que «The AI Scientist Generates Its First Peer-Reviewed Scientific Publication». Se trata del primer artículo generado completamente por IA que ha pasado el mismo proceso de revisión al que someten sus artículos los científicos humanos

El 2 de abril de 2025, la empresa tecnológica  Sakana AI anunció un hito en el campo de la inteligencia artificial y la investigación científica: por primera vez, un artículo generado íntegramente por una IA superó con éxito el proceso de revisión por pares, el mismo procedimiento riguroso al que se someten los trabajos elaborados por investigadores humanos. Este avance representa un punto de inflexión en la relación entre la inteligencia artificial y la producción académica.

El trabajo fue realizado por una versión mejorada de su sistema denominado The AI Scientist-v2, una evolución del modelo original desarrollado por Sakana AI. Aunque los detalles técnicos de esta nueva versión aún no han sido publicados (se prometen en una próxima entrega), se sabe que el experimento se llevó a cabo en colaboración con los organizadores del taller de la conferencia ICLR 2025 (International Conference on Learning Representations), una de las tres principales conferencias internacionales en el campo del aprendizaje automático y la inteligencia artificial, junto con NeurIPS e ICML.

Con el objetivo de garantizar la imparcialidad del proceso, el artículo fue sometido a una revisión a doble ciego: ni los autores del trabajo (en este caso, la IA) ni los evaluadores conocían la identidad de los otros. Aunque se informó al comité de revisión que podría recibir trabajos generados por IA, no se especificó cuáles lo eran, lo que permitió evaluar el contenido en igualdad de condiciones.

La IA fue instruida para investigar y escribir sobre un tema amplio y relevante dentro del campo del aprendizaje profundo. Tras completar el proceso de redacción, se generaron múltiples trabajos, de los cuales se seleccionaron tres para su envío, con el objetivo de no sobrecargar al comité revisor y asegurar la calidad del experimento. Los investigadores humanos responsables del proyecto realizaron un análisis interno de los textos generados y eligieron los tres que consideraron más sólidos, tanto por su calidad técnica como por la diversidad de los temas abordados.

De esos tres artículos, uno fue aceptado tras recibir evaluaciones muy favorables. Obtuvo una puntuación media de 6,33, situándose por encima del umbral medio de aceptación del taller e incluso por encima de muchas propuestas redactadas por científicos humanos. Las valoraciones individuales incluyeron puntuaciones de 6 (ligeramente por encima del umbral de aceptación) y 7 (calificado como un “buen artículo” y con recomendación clara de aceptación).

El objetivo declarado del experimento fue meramente científico: los desarrolladores querían medir, con honestidad y sin intenciones comerciales o engañosas, hasta qué punto una inteligencia artificial es capaz de desempeñar tareas complejas y creativas que tradicionalmente han estado reservadas al intelecto humano. En lugar de levantar sospechas sobre trampas o fraudes en el sistema académico, la intención fue demostrar el potencial real —y los límites— de la inteligencia artificial en la investigación científica contemporánea.

Este acontecimiento abre un debate crucial sobre el futuro de la autoría, la originalidad y la evaluación académica. También plantea preguntas sobre la relación entre humanos y máquinas en el ámbito del conocimiento: ¿Podrán las IA convertirse en colaboradoras regulares de los investigadores humanos? ¿Se redefinirá el concepto de autoría científica? ¿Cómo cambiarán los procesos de revisión y validación de contenidos académicos ante la irrupción de inteligencias artificiales con estas capacidades?

Aunque todavía es pronto para responder con certeza, lo que está claro es que The AI Scientist-v2 ha marcado un antes y un después. A partir de ahora, no solo habrá que competir con otros investigadores en la búsqueda de la verdad científica, sino también con algoritmos que, poco a poco, van demostrando que son capaces no solo de procesar información, sino también de generar conocimiento estructurado y valioso.