La epidemia de citas falsas sacude a la ciencia: miles de artículos biomédicos contienen referencias inventadas por IA

Researchers conducting a biomedical citation audit with papers marked as fake
Researchers carefully reviewing biomedical papers for citation accuracy and fraud detection

Naddaf, Miryam. “Surge in Fake Citations Uncovered by Audit of 2.5 Million Biomedical-Science Papers.Nature, 8 de mayo de 2026. https://doi.org/10.1038/d41586-026-00748-w.

El artículo publicado en Nature por la periodista científica Miryam Naddaf analiza uno de los problemas más inquietantes surgidos en la comunicación científica contemporánea: el rápido aumento de citas bibliográficas falsas o inventadas en artículos académicos biomédicos. El trabajo se basa en una auditoría masiva de 2,5 millones de artículos científicos y cerca de 97 millones de referencias bibliográficas, cuyos resultados muestran que el fenómeno se ha disparado desde 2023, coincidiendo con la expansión del uso de herramientas de inteligencia artificial generativa.

La investigación detectó casi 3.000 artículos biomédicos que contenían referencias imposibles de rastrear en bases de datos académicas reconocidas. Estas citas falsas incluían títulos inexistentes, DOI erróneos o referencias atribuidas a publicaciones que nunca llegaron a existir. Según el estudio, 2.564 artículos presentaban una o dos referencias inventadas, mientras que 246 trabajos acumulaban tres o más citas falsas, lo que revela que el problema ya no es anecdótico, sino estructural.

Uno de los aspectos más alarmantes es la velocidad con la que el fenómeno está creciendo. El análisis mostró que en 2025 había doce veces más artículos con referencias fabricadas que en 2023. Los investigadores consideran que este incremento coincide claramente con la generalización de modelos de lenguaje generativo capaces de producir textos académicos convincentes, pero también propensos a “alucinar” información bibliográfica. Estas herramientas pueden inventar títulos, autores o revistas que parecen plausibles, dificultando enormemente la detección manual de errores.

La metodología utilizada para detectar las referencias falsas combinó inteligencia artificial y verificación documental automatizada. Los investigadores compararon títulos citados con los DOI y PubMed ID asociados, además de contrastar cada referencia con grandes bases bibliográficas como PubMed, Crossref, OpenAlex y Google Scholar. Cuando una referencia no aparecía en ninguno de esos sistemas, era clasificada como potencialmente fabricada. Este procedimiento permitió construir uno de los mayores estudios de integridad bibliográfica realizados hasta la fecha.

El artículo subraya que las consecuencias del problema van mucho más allá de simples errores de citación. Las referencias falsas contaminan la literatura científica, dificultan la verificación del conocimiento y erosionan la confianza en el sistema de publicación académica. En disciplinas biomédicas, donde los artículos pueden influir en decisiones clínicas, tratamientos o políticas sanitarias, una bibliografía inventada puede tener repercusiones especialmente graves.

Además, el texto pone de manifiesto las limitaciones actuales del sistema de revisión por pares. Los revisores rara vez tienen tiempo suficiente para comprobar individualmente cada referencia citada en un manuscrito. Como consecuencia, muchos artículos con bibliografía falsa logran superar los controles editoriales y llegar a la publicación. Los autores del estudio consideran urgente incorporar sistemas automáticos de verificación bibliográfica antes incluso de iniciar la revisión por pares.

Otro aspecto destacado es que el problema no siempre implica fraude deliberado. Algunos investigadores utilizan modelos de IA para generar borradores o ayudar en la redacción y pueden no detectar que determinadas referencias han sido inventadas automáticamente por el sistema. Esto crea una nueva zona gris en la ética científica contemporánea: artículos firmados por autores humanos, pero parcialmente construidos mediante herramientas capaces de producir información inexistente con apariencia académica legítima.

El artículo también recoge la preocupación creciente de especialistas en integridad científica, quienes advierten que las citas falsas podrían ser solo la parte visible de un problema más amplio relacionado con la automatización de la escritura académica. Algunos expertos hablan ya de una “contaminación” progresiva de la literatura científica y alertan de que el prestigio de revistas y sistemas de evaluación podría verse seriamente afectado si no se desarrollan mecanismos de control más rigurosos.

El reportaje de Nature conecta este fenómeno con la transformación más profunda del ecosistema científico en la era de la inteligencia artificial generativa. La facilidad para producir textos complejos, revisiones bibliográficas y manuscritos completos está alterando las dinámicas tradicionales de autoría, revisión y validación del conocimiento. El desafío ya no consiste únicamente en detectar errores, sino en redefinir cómo garantizar la fiabilidad del conocimiento científico en un contexto donde las máquinas pueden producir contenido académico aparentemente verosímil a gran escala.