Análisis de las citas de los motores de búsqueda generativos para detectar la presencia de referencias generadas por IA

Allaham, Mowafak, and Nicholas Diakopoulos. 2026. Synthetic Sources?: Auditing Generative Search Engine Citations for Evidence of AI-Generated Sources. arXiv:2605.23684, May 2026. https://arxiv.org/abs/2605.23684

El artículo analiza un problema emergente en la ecosfera informativa contemporánea: la aparición de “fuentes sintéticas” en los sistemas de búsqueda generativa, es decir, referencias o citas que no provienen de documentos humanos tradicionales verificables, sino que podrían haber sido generadas parcial o totalmente por modelos de inteligencia artificial. Los autores se centran en cómo los motores de búsqueda basados en IA —que combinan recuperación de información con generación de texto— pueden introducir nuevos tipos de distorsión en la cadena de citación científica y periodística.


El trabajo parte de una preocupación central: los sistemas de búsqueda generativa no solo responden preguntas, sino que también construyen aparentes evidencias mediante citas, enlaces o referencias que parecen legítimas. Sin embargo, estas referencias pueden no corresponder a documentos reales, o pueden ser reconstrucciones plausibles generadas por el modelo. Esto plantea un riesgo crítico para la integridad del ecosistema informativo, ya que el usuario puede asumir que una cita es verificable cuando en realidad es una “alucinación documentada” o una fuente fabricada.

Metodológicamente, el estudio propone un enfoque de auditoría para examinar las respuestas de diferentes sistemas de búsqueda generativa. Los autores diseñan un conjunto de procedimientos para analizar la trazabilidad de las citas: verifican si los enlaces conducen a documentos reales, si las fuentes son consistentes con el contenido citado y si existen patrones recurrentes de generación de referencias inexistentes. Este enfoque permite clasificar las citas en diferentes categorías, incluyendo fuentes auténticas, fuentes parcialmente verificables y fuentes completamente sintéticas.

Los resultados muestran que una proporción significativa de las citas generadas por sistemas de IA no puede ser rastreada directamente a publicaciones reales o presenta inconsistencias importantes entre el contenido citado y la fuente original. Esto sugiere que los sistemas de búsqueda generativa pueden producir un tipo de “autoridad simulada”, donde la apariencia de rigor académico o periodístico no está respaldada por una verificación documental sólida.

El estudio analiza en total 19.154 fuentes (URLs con contenido recuperado) que han sido citadas por distintos sistemas de búsqueda generativa. Estas fuentes representan el conjunto de documentos que los modelos consultan y utilizan como apoyo para construir sus respuestas a los usuarios. En este corpus amplio, los investigadores intentan determinar no solo qué dominios se citan, sino también la naturaleza del contenido que contienen.

Dentro de este conjunto, el sistema de detección de contenido generado por inteligencia artificial —en este caso, el modelo Pangram— identifica dos categorías principales de contenido sintético. Por un lado, 2.916 fuentes son clasificadas como “Highly Likely AI”, es decir, textos con una alta probabilidad de haber sido generados por modelos de lenguaje o sistemas automáticos. Por otro lado, 140 fuentes adicionales se clasifican como “Likely AI”, lo que indica una probabilidad significativa, aunque algo menos concluyente, de haber sido producidas o fuertemente asistidas por IA.

Al sumar ambas categorías, el estudio concluye que existen 3.056 documentos sintéticos en total dentro de las fuentes analizadas. Esta cifra no implica únicamente textos completamente generados por IA, sino también aquellos que pueden haber sido parcialmente producidos o editados mediante herramientas de inteligencia artificial, lo que amplía el concepto de “contenido sintético” utilizado en el análisis.

En términos proporcionales, estos 3.056 documentos representan aproximadamente un 16% del total de fuentes examinadas. Este dato es especialmente relevante porque indica que una parte no menor de las fuentes utilizadas por los sistemas de búsqueda generativa podría estar influida por procesos automatizados de generación de texto, lo que introduce posibles sesgos o problemas de calidad en la cadena de información.

El estudio subraya además que esta cifra debe interpretarse como una estimación conservadora o “lower bound”, es decir, un límite inferior. Esto significa que el 16% probablemente no refleja la totalidad real del fenómeno, ya que existen limitaciones técnicas importantes: no todas las páginas pudieron ser analizadas, algunos contenidos multimodales (como PDFs, imágenes o vídeos) quedaron fuera, y además los detectores de IA tienen márgenes de error inherentes.

En consecuencia, los autores advierten que la presencia real de contenido sintético en las citas podría ser igual o incluso superior al 16% estimado. Este resultado sugiere que los sistemas de búsqueda basados en IA están construyendo sus respuestas sobre un ecosistema informativo donde el contenido generado por IA ya es una fracción significativa y potencialmente creciente del total de fuentes disponibles en la web.

El artículo también discute las implicaciones teóricas y prácticas de este fenómeno. En primer lugar, plantea un desafío epistemológico: la noción tradicional de citación como mecanismo de validación del conocimiento se ve erosionada cuando las citas pueden ser generadas artificialmente. En segundo lugar, advierte sobre el impacto en la confianza pública en sistemas de información, especialmente en contextos de alta sensibilidad como salud, política o investigación académica.
Finalmente, los autores proponen la necesidad de nuevos marcos de transparencia y auditoría para sistemas de búsqueda generativa. Esto incluye mecanismos automáticos de verificación de fuentes, estándares de trazabilidad de citas y políticas de diseño que eviten la generación de referencias no comprobables. El objetivo general es preservar la integridad del ecosistema informativo en un entorno donde la frontera entre contenido generado y contenido documentado se vuelve cada vez más difusa.

Radiografía de la desinformación global: la información se ha convertido en un campo de batalla estratégico

Las 10 principales plataformas por volumen de observables

European External Action Service (EEAS). 4th EEAS Report on Foreign Information Manipulation and Interference (FIMI) Threats. Brussels: EEAS, March 2026. Disponible en: https://euvsdisinfo.eu/uploads/2026/03/EEAS-4th-Threat-Report_web-version.pdf

El 4º informe anual del Servicio Europeo de Acción Exterior (EEAS) sobre amenazas de manipulación e interferencia informativa extranjera (FIMI) ofrece una radiografía detallada del ecosistema global de desinformación en 2025 y principios de 2026. El documento confirma que la información se ha convertido en un campo de batalla estratégico central, integrado en dinámicas híbridas que combinan ciberataques, presión política, guerra cognitiva y operaciones de influencia digital.

Uno de los principales hallazgos del informe es el incremento de la escala, sofisticación y automatización de las operaciones FIMI. Durante 2025, el EEAS documentó 540 incidentes globales, con una concentración de ataques especialmente significativa contra Ucrania, Francia, Moldavia y Alemania. El informe subraya que estas campañas no son episodios aislados, sino operaciones continuas, coordinadas y adaptativas, integradas en estrategias geopolíticas más amplias.

El informe identifica además un ecosistema masivo de infraestructura de influencia: aproximadamente 10.500 canales digitales y sitios web fueron utilizados para producir o amplificar contenido manipulado. De estos, una gran mayoría opera como redes encubiertas o inauténticas, mientras que solo una minoría está directamente vinculada a actores estatales visibles. Esto refleja la creciente dependencia de redes proxy, intermediarios y estructuras opacas que permiten negar atribución directa y aumentar la resiliencia de las campañas.

Otro eje central del informe es el papel de la inteligencia artificial (IA). El EEAS señala un salto cualitativo: en 2025, aproximadamente uno de cada cuatro incidentes FIMI implicó herramientas de IA, y el uso de estas tecnologías ha pasado de ser experimental a convertirse en un recurso rutinario. La IA se emplea para generar texto, imágenes, audio y vídeo sintético, así como para traducir y amplificar contenidos en múltiples idiomas, lo que permite una producción masiva, barata y altamente escalable de desinformación.

El informe dedica especial atención a los actores estatales, destacando principalmente a Rusia y China como principales impulsores de campañas FIMI. Estas operaciones muestran patrones comunes: creación de medios falsos, uso de cuentas coordinadas en redes sociales, manipulación de narrativas políticas y explotación de crisis internacionales o procesos electorales. El informe también señala que estas campañas se dirigen no solo a gobiernos, sino también a organizaciones internacionales, medios de comunicación, ONG y figuras públicas.

En el plano conceptual, el EEAS introduce un cambio importante: pasar de la simple evaluación del riesgo a la lógica de la disuasión (deterrence). El informe propone el llamado “FIMI Deterrence Playbook”, un marco operativo destinado a aumentar los costes de estas operaciones y reducir su rentabilidad estratégica. Este enfoque busca actuar sobre toda la cadena de suministro de la desinformación: desde financiadores y organizadores hasta intermediarios tecnológicos y plataformas digitales.

Asimismo, el informe enfatiza la necesidad de una respuesta multinivel y coordinada, que combine sanciones, regulación digital (incluida la Digital Services Act), cooperación judicial y policial, y estrategias de resiliencia social como la alfabetización mediática. La lógica es pasar de una respuesta reactiva a una estrategia anticipatoria y estructural, capaz de desmantelar las infraestructuras que sostienen la manipulación informativa.

En su dimensión política, el informe advierte que la FIMI forma parte de un entorno de competencia geopolítica creciente, donde la información se utiliza como instrumento de poder para influir en elecciones, erosionar la confianza en instituciones democráticas y debilitar la cohesión social dentro de la Unión Europea y sus países socios.

El documento concluye que la FIMI ya no puede entenderse como un problema comunicacional o mediático, sino como un problema de seguridad estratégica y estabilidad democrática. El reto principal para la UE es transformar la comprensión analítica del fenómeno en capacidad operativa de disuasión efectiva, haciendo que estas actividades sean más costosas, menos eficaces y progresivamente inviables.

Google AI Overviews: la precisión de la inteligencia artificial en la búsqueda y el problema de la fiabilidad informativa

Scale comparing accurate AI overview with verified sources and inaccurate AI overview with erroneous sources
Balancing accurate AI overview against errors and hallucinations

Mickle, Tripp, Cade Metz, Dylan Freedman, Teresa Mondría Terol y Keith Collins. «How Accurate Are Google’s A.I. Overviews?» The New York Times, 7 de abril de 2026. https://www.nytimes.com/2026/04/07/technology/google-ai-overviews-accuracy.html
.

El funcionamiento y la fiabilidad de Google AI Overviews, el sistema de respuestas generadas por inteligencia artificial que aparece directamente en los resultados de búsqueda. El informe se centra en una cuestión clave del ecosistema digital actual: hasta qué punto estos resúmenes automáticos pueden considerarse fiables cuando están mediando entre los usuarios y la información en la web.

La investigación parte de una evaluación técnica realizada con metodologías de benchmarking, que sugiere que, aunque el sistema muestra un alto nivel de acierto general, sigue produciendo un volumen significativo de errores debido a la naturaleza probabilística de los modelos de lenguaje.

Uno de los hallazgos principales es que los AI Overviews alcanzan aproximadamente entre un 90% y 91% de precisión en tareas evaluadas, lo que en términos relativos puede parecer un rendimiento elevado. Sin embargo, el artículo subraya que esta cifra adquiere otra dimensión cuando se aplica a la escala masiva de Google, que procesa billones de consultas anuales. En este contexto, incluso un margen de error del 9–10% se traduce en millones de respuestas incorrectas difundidas diariamente, lo que plantea un problema estructural de fiabilidad en la infraestructura informativa global.

El texto también profundiza en la naturaleza del error en los sistemas de inteligencia artificial generativa. A diferencia de los motores de búsqueda tradicionales, que devuelven enlaces a fuentes externas, los AI Overviews sintetizan respuestas directamente. Este proceso implica que los modelos no “verifican” la verdad de la información, sino que generan textos basados en patrones estadísticos de lenguaje. Como resultado, pueden producir afirmaciones plausibles pero incorrectas, especialmente cuando las fuentes subyacentes son ambiguas, contradictorias o de baja calidad.

Otro aspecto relevante del análisis es el impacto epistemológico de este tipo de tecnología. El artículo señala que la integración de respuestas generadas por IA en la parte superior de los resultados de búsqueda transforma la relación entre usuarios e ინფორმაცია: en lugar de acceder a múltiples fuentes para contrastar información, los usuarios reciben una síntesis única que puede ocultar la diversidad o el conflicto entre datos. Esto introduce una tensión entre eficiencia y verificación, ya que la rapidez del acceso a la información puede debilitar los procesos de comprobación crítica.

El informe plantea implicaciones más amplias para el ecosistema digital y la confianza pública en la información en línea. Aunque Google defiende que el sistema mejora continuamente y reduce errores, el estudio sugiere que la escala del problema sigue siendo significativa. En consecuencia, el artículo concluye que la cuestión central no es solo la precisión técnica del sistema, sino su impacto en la arquitectura del conocimiento digital: la forma en que la inteligencia artificial reconfigura qué información se ve, cómo se interpreta y en qué medida puede considerarse fiable en un entorno informativo cada vez más mediado por algoritmos.

La Inteligencia Artificial actúa como un megáfono distorsionador de desinformación masiva

Endert, Julius. “Generative AI is the Ultimate Disinformation Amplifier.DW Akademie, March 26, 2024. https://akademie.dw.com/en/generative-ai-is-the-ultimate-disinformation-amplifier/a-68593890

La Inteligencia Artificial actúa como un megáfono distorsionador: por un lado absorbe datos caóticos de internet y, por el otro, los proyecta amplificados, transformando pequeñas mentiras en un diluvio de desinformación masiva.

La inteligencia artificial está redefiniendo el ecosistema informativo global. Su capacidad para procesar enormes volúmenes de datos, sintetizar información y generar contenido coherente ha sido celebrada como una revolución tecnológica. Sin embargo, existe una dimensión menos visible y potencialmente más peligrosa: su papel como amplificador estructural de la desinformación.

El núcleo del problema: Del consumo a la factoría

  • La fase de consumo: La IA se entrena con millones de textos de internet, absorbiendo verdades, pero también teorías conspirativas, sesgos históricos y datos falsos.
  • La fase de amplificación: Al generar contenido de forma masiva, barata y automatizada, la IA no solo repite lo que aprendió; lo empaqueta en formatos que parecen profesionales (noticias falsas que lucen reales, imágenes sintéticas convincentes), multiplicando el volumen de la mentira a una velocidad que los verificadores humanos no pueden alcanzar.

En este sentido, la IA puede entenderse como un megáfono distorsionador. No necesariamente crea la mentira, pero sí la recoge del entorno digital, la reorganiza y la devuelve amplificada, dotada de mayor coherencia formal, más persuasiva y, en muchos casos, más difícil de detectar.

El ecosistema digital contemporáneo ya está profundamente contaminado por información de baja calidad. Rumores sin verificar, noticias falsas diseñadas estratégicamente, bots automatizados y contenidos clickbait optimizados para la viralidad forman parte de un flujo constante de información caótica. En condiciones tradicionales, este ruido informativo se filtra parcialmente a través de medios de comunicación, periodistas o verificadores de hechos. Sin embargo, en los sistemas de inteligencia artificial generativa, este filtro se vuelve más ambiguo y menos transparente.

La IA no distingue entre verdad y falsedad en términos humanos. Su funcionamiento se basa en el reconocimiento de patrones lingüísticos, probabilidades estadísticas y correlaciones entre datos. En otras palabras, no opera con un modelo de verdad, sino con un modelo de coherencia. Esto genera un problema estructural: aquello que es falso, pero aparece repetido con suficiente frecuencia en los datos, puede adquirir apariencia de verosimilitud dentro del sistema.

El núcleo del problema reside precisamente en esta ausencia de epistemología. Los algoritmos de aprendizaje automático procesan grandes volúmenes de información heterogénea, mezclan fuentes de distinta calidad y generan respuestas que priorizan la plausibilidad lingüística. El resultado es la posibilidad de que la coherencia sustituya a la veracidad como criterio dominante.

En este contexto, surge un efecto de cámara de eco automatizado. Una vez que los sistemas han sido entrenados con datos contaminados, pueden reproducir narrativas sesgadas, interpretaciones incompletas o errores que aparecen reformulados como si fueran hechos. Sin embargo, el aspecto más preocupante no es la simple repetición, sino la capacidad de reformulación constante.

La inteligencia artificial no copia la desinformación de forma literal, sino que la reescribe. En ese proceso, le otorga apariencia de novedad, adopta estilos comunicativos profesionales y elimina rastros evidentes de su origen dudoso. Esto contribuye a que la mentira se vuelva más sofisticada, más creíble y mucho más difícil de rastrear.

Cuando este contenido generado se traslada al espacio público, entra en una fase de amplificación masiva. La IA funciona entonces como un megáfono digital capaz de producir múltiples versiones de un mismo mensaje, adaptarlo a diferentes audiencias, generar textos, imágenes o vídeos hiperrealistas y simular voces o estilos periodísticos. El resultado es una auténtica industrialización de la desinformación, donde ya no existen falsedades aisladas, sino ecosistemas completos de réplicas coordinadas.

En este nuevo entorno emergen formas específicas de desinformación automatizada. Por un lado, la saturación de medios clonados, es decir, sitios web que imitan portales informativos legítimos y que se generan automáticamente para reforzar determinadas narrativas. Por otro, los deepfakes hiperrealistas, capaces de recrear con gran precisión eventos que nunca ocurrieron. Finalmente, los artículos hiperpartidistas automatizados, textos generados en segundos que imitan el estilo periodístico pero están diseñados para polarizar y manipular la opinión pública.

Este proceso implica un cambio estructural profundo: la transición de la IA de consumidora de información a productora masiva de narrativas. Durante su fase de consumo, los sistemas se entrenan con un entorno digital donde conviven textos fiables, teorías conspirativas, sesgos históricos y errores acumulados. El problema no es la diversidad de datos, sino la ausencia de jerarquía epistemológica que permita distinguir su valor.

En la fase de amplificación, la IA reconfigura ese material sin mecanismos robustos de verificación de verdad. Reempaqueta la información en formatos persuasivos y acelera su difusión a una escala sin precedentes. De este modo, el sistema deja de ser únicamente un repositorio de conocimiento para convertirse en una factoría de narrativas.

El resultado es un ecosistema de realidad cada vez más inestable. La saturación informativa se vuelve constante, las fronteras entre lo real y lo simulado se difuminan, la confianza en las fuentes tradicionales disminuye y la verificación de hechos se vuelve progresivamente más compleja. En este contexto, la desinformación deja de ser una anomalía puntual y pasa a integrarse como un subproducto estructural del sistema informativo automatizado.

Por ello, la inteligencia artificial no puede entenderse únicamente como una herramienta neutral. Su funcionamiento actual la sitúa como un sistema de transformación masiva de información que puede tanto ampliar el acceso al conocimiento como intensificar sus distorsiones. El problema no es solo tecnológico, sino profundamente epistemológico: cómo distinguir la verdad cuando la falsedad puede ser generada, replicada y estilizada con la misma eficacia formal.

La respuesta no puede ser exclusivamente técnica. Requiere educación crítica, alfabetización mediática y nuevos marcos de gobernanza digital. En un entorno donde la inteligencia artificial amplifica todo, la cuestión central ya no es únicamente qué es información, sino qué significa todavía hablar de verdad.

Biblioteca de la Escuela Superior de Arte Dramático (ESADCyL) y la Escuela Profesional de Danza (EPDCyL) de Castilla y León con Berta Cuadrado. Planeta Biblioteca 2026/05/25

Biblioteca de la Escuela Superior de Arte Dramático (ESADCyL) y la Escuela Profesional de Danza (EPDCyL) de Castilla y León con Berta Cuadrado.

Planeta Biblioteca 2026/05/25

ESCUCHAR

Descargar

La entrevista a Berta Cuadrado en el programa Planeta Biblioteca de Radio Universidad de Salamanca ofrece una amplia reflexión sobre el papel de las bibliotecas especializadas en artes escénicas y sobre la necesidad de transformar estos espacios en entornos creativos, cercanos y comunitarios. Berta Cuadrado Mayoral expone cómo su trayectoria profesional —que incluye trabajo en archivos, bibliotecas públicas, proyectos culturales y enseñanza del español para extranjeros— le ha permitido desarrollar una visión interdisciplinar de la profesión bibliotecaria, donde la mediación cultural y la atención personalizada son fundamentales.

Uno de los ejes centrales de la conversación es la singularidad de la biblioteca de la Escuela Superior de Arte Dramático y de la Escuela Profesional de Danza de Castilla y León. Berta explica que una biblioteca de artes escénicas no solo conserva libros, sino también materiales audiovisuales, carteles, documentos efímeros y recursos vinculados directamente con la creación artística y la práctica escénica. Esta diversidad documental obliga a desarrollar modelos de organización híbridos y dinámicos, adaptados a las necesidades de estudiantes, docentes e investigadores del ámbito artístico.

La entrevista también subraya la importancia del apoyo documental a los trabajos académicos y proyectos creativos. Berta destaca que los estudiantes de arte dramático y danza necesitan aprender a localizar, evaluar y citar información especializada, por lo que las competencias informacionales son hoy imprescindibles también en las enseñanzas artísticas. En este contexto, la biblioteca actúa como un espacio formativo que enseña a investigar y a gestionar información en un entorno cada vez más digital.

Otro aspecto especialmente relevante es la dimensión emocional y comunitaria de la biblioteca. Iniciativas como “Libro enjaulado”, “BookFace”, “Más que palabros” o los “rincones de pensar y de botar” muestran una concepción innovadora de la biblioteca como lugar de convivencia, creatividad y bienestar. Para Berta Cuadrado, la biblioteca ya no es únicamente un espacio silencioso destinado al estudio, sino un entorno vivo donde las personas pueden expresarse, compartir experiencias y desarrollar sensibilidad artística.

Durante la entrevista también se abordan los retos de las bibliotecas especializadas en España, especialmente la falta de reconocimiento y de estructuras estables en muchos centros de enseñanzas artísticas superiores. Berta reivindica la necesidad de fortalecer estas bibliotecas como herramientas esenciales para la formación, la investigación y la preservación de la memoria escénica.

Análisis comparativo y evaluación de la cobertura y estructura de las bases de datos científicas en la investigación académica

De-Moya-Anegón, Félix; Sánchez-Jiménez, Rodrigo; Halevi, Gali; Guerrero-Bote, Vicente P.; Guerrero-Castillo, Pablo; Rivadeneyra, Federico (2026). A Comparative Analysis of Open and Commercial Bibliographic Infrastructures: Scale, Metadata Standardization, and Implications for Bibliometric Evaluation. Granada: Ediciones Profesionales de la Información, 48 pp. ISBN: 978-84-125757-8-1

Texto completo

El informe analiza la viabilidad estructural de las infraestructuras bibliográficas abiertas para su uso en evaluación de la investigación, comparándolas con bases de datos comerciales como Scopus en aspectos clave como cobertura, calidad de metadatos, interoperabilidad y utilidad en flujos de trabajo bibliométricos. El contexto está marcado por el impulso de marcos políticos recientes como CoARA y la Declaración de Barcelona, que promueven una transición hacia datos de investigación abiertos. Sin embargo, el estudio muestra que esta transición no es lineal, ya que existe una tensión estructural entre la enorme escala de las plataformas abiertas y la estandarización de sus metadatos, lo que genera un dilema entre cobertura masiva y consistencia analítica.

Las plataformas abiertas como OpenAIRE, OpenAlex y The Lens superan ampliamente a Scopus en volumen de registros, pero este crecimiento se produce a costa de una menor calidad y completitud de los metadatos. Problemas como la ausencia de afiliaciones en más del 55% de los registros, la baja normalización de identificadores como ISSN y DOI, y una clasificación documental excesivamente algorítmica afectan directamente a su aplicabilidad en evaluación institucional. Esta situación limita su uso directo en bibliometría, especialmente en análisis comparativos entre instituciones o países.

El informe también destaca una dinámica asimétrica en los flujos de citación: el “long tail” de las bases abiertas no redistribuye de forma equilibrada el impacto científico, sino que tiende a reforzar la centralidad de la literatura ya indexada en bases comerciales. En otras palabras, la ampliación del corpus abierto no se traduce automáticamente en una democratización del impacto científico, sino que en muchos casos consolida estructuras previas de visibilidad. A ello se suman desigualdades geográficas persistentes, con mejoras en regiones como América Latina y África, pero con importantes vacíos en Asia y Oriente Medio, además de déficits en tipologías documentales complejas como monografías de humanidades o actas de congresos.

Por otro lado, las plataformas abiertas enfrentan importantes compromisos estructurales: The Lens presenta dificultades en la estandarización global de metadatos, registrando las tasas más bajas de presencia de ISSN y DOI y un déficit del 71,67% en la captura de actas de congresos. OpenAlex depende en gran medida de datos de origen no estructurados, con un 41,5% de sus registros (con fuente) sin ISSN, y presenta un posible sesgo analítico debido a la sobre-etiquetación algorítmica de documentos como «artículos». Finalmente, OpenAIRE presenta anomalías técnicas relevantes, incluyendo más de un millón de DOI duplicados y la tasa más alta de documentos no clasificados (23,1%) dentro del núcleo curado, lo que resulta en el menor ratio global de impacto de citación del grupo.

Finalmente, el estudio subraya que cada plataforma abierta presenta fortalezas y debilidades específicas: The Lens destaca por su integración con patentes y su utilidad en análisis de transferencia tecnológica; OpenAlex por su alta alineación con registros de Scopus y su densidad de citación en el núcleo coincidente; y OpenAIRE por su mayor cobertura de identificadores persistentes y menor ausencia de afiliaciones. Sin embargo, todas comparten limitaciones estructurales cuando se utilizan sin procesos rigurosos de normalización y depuración. La conclusión central es que el acceso abierto a grandes volúmenes de datos no equivale automáticamente a su validez evaluativa, y que el futuro de la evaluación científica abierta depende de pasar de la mera disponibilidad de datos a su validación activa y metodológicamente controlada.

La inteligencia artificial ya no solo “consume” información de internet, sino que está amplificando y reproduciendo desinformación a gran escala

Get Fact First. 2026. “AI Is Now Running the Mis and Disinformation.” Get Fact First (Substack). Accedido el 25 de mayo de 2026. https://getfactfirst.substack.com/p/ai-is-now-running-the-mis-and-disinformation

La inteligencia artificial ha pasado de ser una herramienta auxiliar en la producción y distribución de información a convertirse en un componente estructural dentro del ecosistema global de la desinformación. En lugar de limitarse a responder preguntas o resumir contenidos, los sistemas generativos actuales participan activamente en la circulación, reformulación y amplificación de narrativas informativas, incluidas aquellas que pueden ser falsas, sesgadas o directamente manipuladas.

El último informe de amenazas de la UE concluyó que el 27% de los incidentes de manipulación de información extranjera en 2025 involucraron IA. Y esto es solo lo que está en el dominio público. Rusia ha invertido una cifra récord de 1.850 millones de dólares en propaganda exterior para 2026, un 54% más en un año. Irán también está inyectando nuevo dinero en su cadena estatal de radiodifusión. La guerra de Irán de 2026 se ha convertido en un banco de pruebas en tiempo real, con Rusia y China ejecutando operaciones paralelas y compartiendo inteligencia mientras lo hacen.

Investigadores del Information Sciences Institute de la USC introdujeron un puñado de agentes de IA en una red social simulada y les dieron una única tarea: ejecutar una campaña de propaganda. Nadie los programó ni les indicó cómo hacerlo. Ellos lo resolvieron por sí mismos: publicaciones sincronizadas, inundación de hashtags, el mismo mensaje con distintas voces, y una coordinación del público objetivo. Cada acción que reconocerías de una operación de influencia real fue inventada desde cero por el software. Los investigadores lo dicen de forma sencilla: esto no es una amenaza futura, ya es técnicamente posible. Diez agentes lo hicieron en un laboratorio, y es seguro que esto ya lleva tiempo ocurriendo fuera de él. El coste de fabricar una realidad falsa ha caído prácticamente a cero, los presupuestos estatales detrás de ello están aumentando, y el ser humano ha quedado fuera del proceso.

Miremos las elecciones del año pasado en Irlanda. Días antes de la votación presidencial, apareció un falso boletín de “RTÉ News” anunciando que la candidata Catherine Connolly se había retirado de la carrera y que las elecciones se habían cancelado. Estuvo activo durante doce horas y acumuló 30.000 visualizaciones antes de ser retirado. Ella no se había retirado.

Una de las ideas centrales es que los modelos de IA no operan con una noción de verdad, sino con correlaciones estadísticas del lenguaje. Esto significa que su funcionamiento no se basa en comprobar la veracidad de los datos, sino en predecir la continuación más probable de un texto. En consecuencia, cuando la red contiene información incorrecta ampliamente difundida, existe el riesgo de que esa información sea integrada en los modelos y posteriormente reproducida con un formato convincente, lo que incrementa su credibilidad percibida. Este fenómeno genera lo que el artículo describe como una apariencia de autoridad sin verificación epistémica real.

El texto también enfatiza el carácter acumulativo del problema. La desinformación en internet no es nueva, pero la IA introduce una capa de aceleración y automatización. Plataformas, redes sociales, foros y sitios de baja fiabilidad constituyen un entorno donde la información circula sin control riguroso. En ese contexto, los modelos de IA actúan como sistemas de compresión y redistribución de información: sintetizan grandes volúmenes de contenido y lo devuelven al usuario en forma de respuestas claras y aparentemente neutrales. Sin embargo, esa síntesis puede diluir matices, eliminar fuentes o reforzar errores existentes.

Otro punto relevante del artículo es la transformación del fenómeno propagandístico. Tradicionalmente, la desinformación requería actores humanos que diseñaran campañas, produjeran contenido y lo distribuyeran de forma coordinada. Con la aparición de sistemas automatizados, ese proceso puede ejecutarse de manera continua, escalable y con menor coste. El resultado es un ecosistema donde bots, modelos generativos y herramientas de automatización pueden sostener narrativas falsas durante largos periodos sin intervención directa constante.

El artículo también introduce una dimensión social y cognitiva: la erosión progresiva de la confianza informativa. No se trata solo de que exista más información falsa, sino de que se debilita la capacidad del público para distinguir entre fuentes fiables y no fiables. Cuando los usuarios reciben respuestas coherentes, bien redactadas y aparentemente neutrales de sistemas automatizados, puede generarse una confianza excesiva en la forma del mensaje por encima de su contenido real.

El texto sugiere que la desinformación automatizada no es un fenómeno marginal, sino una tendencia estructural que podría redefinir la ecología informativa contemporánea. En este escenario, la IA no es únicamente un intermediario, sino un actor que participa en la construcción misma del espacio público digital, con implicaciones directas para la comunicación política, la ciencia, el periodismo y la educación mediática.

Spotify lanza una herramienta para crear audiolibros con tecnología de ElevenLabs.

Mehta, Ivan. (2026, 21 de mayo). Spotify launches an ElevenLabs-powered audiobook creation tool. TechCrunch. https://techcrunch.com/2026/05/21/spotify-launches-an-elevenlabs-powered-audiobook-creation-tool/

Spotify ha anunciado una nueva herramienta de creación de audiolibros basada en inteligencia artificial, desarrollada en colaboración con la empresa de voz sintética ElevenLabs. Esta funcionalidad se integra dentro de la plataforma Spotify for Authors, orientada a autores y editores que desean producir y distribuir audiolibros directamente desde el ecosistema de Spotify.

El objetivo principal de esta herramienta es reducir las barreras técnicas, económicas y temporales que tradicionalmente han limitado la producción de audiolibros. En lugar de depender de estudios de grabación profesionales o narradores humanos, los autores podrán generar versiones en audio de sus obras utilizando voces sintéticas de alta calidad, creadas mediante modelos de IA avanzados.

La herramienta se presenta como un sistema de autoedición de audiolibros, en el que el usuario puede subir su manuscrito y obtener una narración completa generada automáticamente. Según la información disponible, el servicio estará disponible inicialmente en inglés y en formato beta por invitación, con un despliegue progresivo previsto para 2026.

Uno de los aspectos más relevantes es que Spotify no impone exclusividad sobre los contenidos generados. Esto significa que los autores podrán distribuir sus audiolibros en otras plataformas además de Spotify, lo que mantiene un modelo de publicación flexible. Esta decisión refuerza la estrategia de la compañía de posicionarse como un actor clave en el mercado del audio digital, sin restringir a los creadores a su ecosistema.

La tecnología de ElevenLabs aporta voces sintéticas altamente realistas, capaces de reproducir entonación, ritmo y matices emocionales con mayor naturalidad que generaciones anteriores de síntesis de voz. Esto permite que los audiolibros generados por IA se acerquen cada vez más a la experiencia de la narración humana, aunque aún pueden existir variaciones en calidad y naturalidad según el texto.

Este lanzamiento se inscribe en una estrategia más amplia de Spotify, que está expandiendo su uso de inteligencia artificial en múltiples frentes: generación de podcasts personalizados, herramientas de interacción con contenido, y nuevas formas de producción automatizada de audio. En conjunto, la empresa está evolucionando desde una plataforma de distribución de audio hacia un entorno de creación y generación de contenido sonoro impulsado por IA.

No obstante, el movimiento también plantea debates relevantes en la industria editorial y del audio: desde el impacto en los narradores profesionales hasta cuestiones de calidad, autenticidad y regulación del contenido generado por inteligencia artificial.

En síntesis, esta iniciativa representa un paso significativo hacia la automatización de la producción de audiolibros, democratizando su creación pero también reconfigurando el papel de los profesionales del sector editorial y del audio.

ChatGPT para PowerPoint (beta): Crea y edita presentaciones con ChatGPT.

OpenAI. (2026). ChatGPT for PowerPoint (beta): Create and edit presentations with ChatGPT. Disponible en: https://chatgpt.com/apps/powerpoint

La nueva integración de ChatGPT para PowerPoint es una herramienta en fase beta que incorpora la inteligencia artificial directamente dentro del entorno de Microsoft PowerPoint. Su objetivo principal es transformar la manera en que se crean y editan presentaciones, permitiendo que el usuario trabaje con lenguaje natural sin necesidad de salir del programa.

A diferencia de los flujos tradicionales —donde primero se genera contenido en un chatbot y luego se traslada manualmente a las diapositivas— esta integración permite actuar directamente sobre el archivo de PowerPoint. El sistema funciona como una barra lateral dentro del propio programa, desde la cual el usuario puede pedir a ChatGPT que cree nuevas diapositivas, reorganice el contenido, resuma documentos o mejore la narrativa de una presentación ya existente.

Entre sus capacidades principales destacan:

  • La creación automática de presentaciones a partir de notas, documentos, hojas de cálculo o incluso una presentación ya existente.
  • La edición de diapositivas concretas, ajustando texto, estructura o tono según el público objetivo.
  • La reescritura y síntesis de contenido largo en mensajes más claros y orientados a la comunicación visual.
  • El análisis del propio discurso de la presentación, identificando lagunas, incoherencias o mejoras posibles en la historia que cuenta el conjunto de diapositivas.

Esta herramienta está pensada especialmente para contextos profesionales y educativos: informes ejecutivos, presentaciones corporativas, trabajos académicos o revisiones estratégicas. Su valor añadido es que no solo automatiza la generación de contenido, sino que ayuda a estructurar mejor el relato de la presentación.

Sin embargo, al tratarse de una versión beta, presenta limitaciones importantes. Los resultados pueden requerir revisión humana, ya que pueden contener errores, inconsistencias o problemas de formato. Además, algunas funciones avanzadas de PowerPoint (como diseños complejos, gráficos sofisticados o ajustes muy precisos de estilo) aún no están completamente optimizadas.

En conjunto, esta integración refleja una tendencia más amplia: la incorporación de la IA en herramientas de productividad cotidianas. En lugar de ser un asistente externo, ChatGPT se convierte en un componente integrado del flujo de trabajo, reduciendo fricciones y acercando la creación de presentaciones a un proceso conversacional, más rápido y flexible.

De oyentes a exploradores: reinventando las actividades infantiles en bibliotecas

Teacher reading 'The Gruffalo's Child' to children during storytime in a colorful library corner

Curious Kids: A Program for the Children We Were Losing After Storytime”, publicado en el blog de la Association for Library Service to Children (ALSC), división de la American Library Association.

ALSC Blog

Se propone una reflexión sobre uno de los desafíos más frecuentes en las bibliotecas infantiles: qué ocurre con aquellos niños que “envejecen” para los programas tradicionales de cuentacuentos, pero que todavía no encuentran su lugar en las actividades pensadas para preadolescentes o adolescentes.

A partir de esta preocupación nace “Curious Kids”, una iniciativa diseñada específicamente para retener a esos usuarios infantiles que comenzaban a desaparecer de la biblioteca después de los programas de primera infancia. El texto parte de una observación sencilla pero reveladora: muchos niños dejan de asistir a la biblioteca no porque pierdan el interés por aprender, sino porque los formatos disponibles dejan de responder a su necesidad creciente de participación activa, exploración y descubrimiento.

El programa “Curious Kids” se plantea así como una transición entre el universo del storytime y experiencias más autónomas de aprendizaje. La propuesta apuesta por actividades basadas en la curiosidad, la experimentación y la interacción práctica. Frente al modelo tradicional en el que el niño escucha pasivamente una historia, aquí se fomenta que pregunte, manipule, construya y participe. El artículo subraya que los niños de entre seis y once años suelen encontrarse en una etapa especialmente compleja desde el punto de vista bibliotecario: ya no desean actividades percibidas como “para pequeños”, pero todavía necesitan espacios guiados, sociales y creativos donde sentirse cómodos y reconocidos.

Uno de los aspectos más interesantes del texto es la reivindicación de la curiosidad como motor educativo. El programa no se centra únicamente en promover la lectura de manera directa, sino en convertir la biblioteca en un espacio de descubrimiento integral. Ciencia, arte, manualidades, preguntas sobre el mundo natural, juegos de lógica o actividades de exploración forman parte de una filosofía que entiende que el interés por los libros surge muchas veces de una experiencia previa de asombro. La biblioteca deja así de ser exclusivamente un lugar para leer y se convierte en un entorno de investigación y creatividad infantil.

El artículo también destaca la importancia del diseño inclusivo de programas infantiles. Muchos niños abandonan las actividades bibliotecarias porque sienten que estas ya no están pensadas para ellos. “Curious Kids” intenta precisamente evitar esa pérdida de conexión emocional con la biblioteca. La iniciativa reconoce que no todos los niños aprenden del mismo modo ni responden igual a las dinámicas tradicionales. Algunos necesitan movimiento, experimentación o trabajo colaborativo. Otros encuentran motivación en desafíos prácticos o en actividades STEM. Esta flexibilidad metodológica permite ampliar la participación y atraer perfiles de usuarios que quizás no encajarían en programas más convencionales.

Otro elemento relevante es la dimensión comunitaria del proyecto. El programa no solo busca entretener, sino consolidar la biblioteca como espacio seguro de pertenencia y crecimiento. En un contexto en el que muchos niños pasan gran parte de su tiempo frente a pantallas o en actividades altamente estructuradas, la biblioteca aparece como un lugar donde pueden explorar libremente sus intereses. El texto sugiere que este tipo de iniciativas ayudan a fortalecer la relación de largo plazo entre los niños y la institución bibliotecaria, favoreciendo que continúen siendo usuarios activos durante la adolescencia y la vida adulta.

La experiencia descrita conecta además con una tendencia más amplia dentro de los servicios bibliotecarios infantiles contemporáneos: el paso de modelos centrados únicamente en la alfabetización temprana hacia enfoques que integran creatividad, aprendizaje informal, participación y desarrollo socioemocional. Numerosas bibliotecas están reformulando sus programas para responder a las necesidades cambiantes de las familias y de las nuevas generaciones de usuarios.

Curious Kids” demuestra que pequeños cambios en la concepción de las actividades pueden tener un impacto importante en la fidelización de los niños y en la construcción de una biblioteca más participativa, flexible y adaptada a las distintas etapas del desarrollo infantil.