Citas científicas falsas generadas por IA: un problema creciente que amenaza la integridad de la literatura académica

Mondal, S. (2026, 18 de mayo). AI-generated fake citations are flooding scientific literature across publications, scientists warn. Phys.org. https://phys.org/news/2026-05-ai-generated-fake-citations-scientific.html

Se informa de una creciente preocupación en la comunidad científica ante la proliferación de citas bibliográficas falsas generadas por sistemas de inteligencia artificial en artículos académicos. Según un estudio reciente citado por Phys.org, el uso cada vez más extendido de modelos de lenguaje en la redacción científica está provocando que aparezcan referencias que no corresponden a publicaciones reales, lo que compromete la trazabilidad del conocimiento científico y la fiabilidad de la literatura académica.

Las citas al final de un artículo de investigación deberían representar una base sólida del conocimiento existente sobre un campo concreto, un conjunto de fuentes revisadas por pares construido a lo largo de años de investigación y estudio. Sin embargo, con el uso creciente de la IA y de los modelos de lenguaje de gran tamaño en la redacción de trabajos científicos, existe una posibilidad cada vez mayor de que la cita en la que alguien hace clic ni siquiera exista, y de que el estudio, la fuente o incluso los propios investigadores sean completamente falsos.

Uno de los hallazgos más relevantes del estudio es la magnitud del fenómeno: los investigadores detectaron aproximadamente 146.900 citas inexistentes en artículos científicos publicados en 2025, distribuidos en repositorios de gran relevancia como arXiv, bioRxiv, SSRN y PubMed Central. Este dato sugiere que el problema no es marginal ni anecdótico, sino estructural y extendido a múltiples disciplinas y plataformas de publicación.

El artículo explica que estas “alucinaciones bibliográficas” no suelen aparecer como errores masivos en un solo documento, sino como pequeñas cantidades de referencias falsas dispersas en numerosos artículos. Esto dificulta su detección mediante los sistemas tradicionales de revisión por pares, que no siempre verifican de forma exhaustiva la existencia real de cada fuente citada. El resultado es que estas referencias pueden incorporarse al registro científico y ser reutilizadas en trabajos posteriores, amplificando el problema.

Asimismo, el estudio sugiere que el fenómeno está relacionado con la adopción creciente de herramientas de inteligencia artificial en el proceso de escritura académica. Los modelos generativos pueden producir citas plausibles en apariencia, pero carentes de correspondencia real con publicaciones existentes, lo que introduce un riesgo sistémico en la producción de conocimiento científico. Esto afecta especialmente a la confianza en los mecanismos de validación académica y plantea la necesidad de reforzar los controles editoriales y las herramientas automáticas de verificación de referencias.

En este estudio, el equipo realizó una auditoría a gran escala de 111 millones de referencias extraídas de 2,5 millones de artículos científicos. Mediante una combinación de comprobaciones automáticas y manuales, buscaron títulos de citas que no pudieran vincularse a ninguna publicación real.

Más del 95% de las referencias fueron verificadas con éxito. En las restantes, corrigieron errores tipográficos con ayuda de IA hasta encontrar una coincidencia, y para los pocos títulos aún no identificados recurrieron a Google Scholar para asegurarse de que no se pasaba por alto ninguna publicación poco conocida.

Para aislar el papel de la IA, el equipo también analizó las tasas de citas no coincidentes antes de 2023, es decir, antes de la aparición generalizada de ChatGPT, Gemini y otros modelos de lenguaje, lo que sirvió como línea base para medir cuánto del problema podía atribuirse a la IA frente al error humano.

Los datos también revelaron lagunas en los sistemas de control, como la moderación de preprints, los editores de revistas y la revisión por pares, que solo detectaban una pequeña parte de estos errores. Por ejemplo, aunque la moderación de arXiv detectó algunos casos, se estima que el 78,8% de las citas inexistentes pasaron el filtro y fueron publicadas en la plataforma.

El estudio encontró que los científicos en etapas iniciales de su carrera y los equipos pequeños eran los más dados a incluir estas citas falsas, y en algunos casos estos mismos investigadores habían visto aumentar su productividad aproximadamente tres veces desde la llegada de la IA.

En conjunto, el artículo subraya que la expansión de la inteligencia artificial en la investigación científica está generando beneficios en términos de productividad, pero también nuevos riesgos para la integridad del sistema científico. La aparición de citas falsas no solo afecta a la calidad de los artículos individuales, sino que puede erosionar la base de conocimiento sobre la que se construye la ciencia contemporánea, lo que obliga a replantear los procesos de revisión, edición y validación de la literatura académica.

	IA en bibliotecas: d… en Implementación de un chatbot d…
	IA en bibliotecas: d… en Declaración de la IFLA sobre d…
	IA en bibliotecas: d… en Principios Rectores de las Bib…
	IA en bibliotecas: d… en Competencias en IA para trabaj…
	¿Se puede reconocer… en ¿Por qué ChatGPT utiliza frecu…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca

Citas científicas falsas generadas por IA: un problema creciente que amenaza la integridad de la literatura académica

Comparte esto: