Archivo de la etiqueta: Detectores

¿Son realmente fiables los detectores de IA?

Nield, D. (19 de julio de 2026). Do AI Detectors Really Work? We Put Five to the Test. Popular Science. https://www.popsci.com/technology/do-ai-detectors-really-work-tech-tested/?utm_source=flipboard&utm_content=user/PopularScience

El crecimiento del uso de herramientas de inteligencia artificial como ChatGPT, Gemini o Claude ha generado una nueva preocupación en ámbitos como la educación, el periodismo, la contratación de personal y la creación de contenidos: ¿es posible distinguir con fiabilidad un texto escrito por una persona de otro generado por una IA? Para responder a esta pregunta, Popular Science realizó una prueba práctica con cinco de los detectores de IA más populares del mercado: Pangram, Grammarly, GPTZero, Scribbr y Copyleaks.

Los detectores de texto generado por inteligencia artificial se han convertido en una herramienta habitual en escuelas, universidades y empresas preocupadas por el uso de modelos como ChatGPT, Gemini o Claude. Sin embargo, una prueba realizada por Popular Science demuestra que estas aplicaciones están lejos de ser infalibles. El artículo evaluó cinco detectores ampliamente utilizados enfrentándolos tanto a textos escritos íntegramente por una persona como a otros producidos por diferentes modelos de IA.

El objetivo era comprobar si realmente pueden distinguir con precisión entre escritura humana y escritura artificial. Los resultados revelan que todos los sistemas analizados cometieron errores, aunque en distinta medida, lo que pone de manifiesto las limitaciones actuales de esta tecnología.

La principal conclusión es que ningún detector ofrece una fiabilidad del 100 %. Algunas herramientas identificaron correctamente buena parte de los textos generados por IA, pero también clasificaron como artificiales escritos completamente humanos (falsos positivos) y, a la inversa, consideraron como humanos algunos textos creados por modelos de lenguaje (falsos negativos). Esta variabilidad se debe a que los detectores no reconocen el origen real de un documento, sino que calculan la probabilidad de que un texto presente determinados patrones estadísticos característicos de la escritura generada por IA, como la baja «perplejidad» o una estructura lingüística especialmente uniforme.

Pangram: el detector más preciso

La primera herramienta evaluada fue Pangram, que se presenta como «un detector de IA que realmente funciona». En la prueba obtuvo un resultado perfecto. Reconoció correctamente ambos textos escritos por el autor como completamente humanos, asignándoles un 100 % de probabilidad de autoría humana y un alto grado de confianza. Del mismo modo, identificó correctamente los textos generados por ChatGPT y Claude como escritos íntegramente por IA. Además de emitir un porcentaje, explicó qué expresiones o estructuras habían influido en su decisión, señalando algunas frases típicas del estilo de los modelos de lenguaje.

Grammarly: muy fiable, aunque menos contundente

La segunda herramienta fue Grammarly, conocida tradicionalmente por sus funciones de corrección ortográfica y gramatical, pero que también incorpora un detector de IA. Los dos textos humanos fueron clasificados correctamente como escritos por una persona, sin detectar ningún patrón asociado a inteligencia artificial. Sin embargo, cuando analizó los textos generados por Claude y Gemini, sí detectó que probablemente habían sido creados mediante IA, aunque con un grado de confianza inferior al de Pangram: uno recibió una probabilidad del 68 % y el otro del 66 % de haber sido generado artificialmente. Es decir, Grammarly acertó en todos los casos, aunque mostró mayor cautela en sus conclusiones.

GPTZero: otra de las herramientas más fiables

El tercer detector fue GPTZero, una de las aplicaciones más conocidas en el ámbito educativo y universitario. Los dos textos escritos por el autor fueron clasificados como completamente humanos, indicando incluso que existía una elevada confianza en esa conclusión. Cuando analizó los textos producidos por Gemini y ChatGPT también los identificó correctamente como generados por inteligencia artificial. Una característica interesante de GPTZero es que no solo ofrece una valoración global, sino que señala las frases concretas que considera más características de un texto generado por IA. Sin embargo, el propio autor reconoce que, al revisar esas frases, no siempre resulta evidente qué rasgos específicos justifican dicha clasificación.

Scribbr: el gran decepcionante

La cuarta herramienta fue Scribbr, conocida principalmente por sus servicios de revisión académica. En este caso, el detector identificó correctamente los textos humanos como escritos por personas. Sin embargo, falló completamente al analizar los textos generados por IA, clasificándolos también como totalmente humanos. Lo más llamativo es que el sistema mostró una elevada confianza en sus conclusiones erróneas, lo que pone de manifiesto una calibración insuficiente para detectar contenidos generados por modelos actuales.

Copyleaks: resultados irregulares

El último detector analizado fue Copyleaks, una plataforma que también ofrece herramientas para detectar imágenes y vídeos generados mediante IA. Como ocurrió con los demás detectores, identificó correctamente los textos humanos. Sin embargo, al evaluar los textos generados por IA obtuvo resultados contradictorios: uno de ellos fue clasificado erróneamente como completamente humano, mientras que el otro fue detectado correctamente como generado por inteligencia artificial. Esta inconsistencia llevó al autor a concluir que la calibración del sistema todavía necesita mejoras.

Detector	Textos humanos	Textos IA	Resultado
Pangram	✔✔	✔✔	4/4
Grammarly	✔✔	✔✔	4/4
GPTZero	✔✔	✔✔	4/4
Scribbr	✔✔	✘✘	2/4
Copyleaks	✔✔	✔✘	3/4

El reportaje explica que basta con realizar pequeñas modificaciones en un texto generado por IA para dificultar considerablemente su detección. Una revisión manual, la incorporación de experiencias personales o incluso el uso de herramientas de reformulación pueden alterar los patrones lingüísticos que utilizan los detectores para emitir sus predicciones. Del mismo modo, textos escritos por personas con un estilo muy formal, repetitivo o académico pueden ser erróneamente etiquetados como contenidos generados por inteligencia artificial. Esta limitación resulta especialmente preocupante en el ámbito educativo, donde ya se han documentado casos de estudiantes acusados injustamente debido a la confianza excesiva depositada en estas herramientas.

Otra conclusión importante del análisis es que los detectores deben considerarse únicamente un indicio y nunca una prueba definitiva. El artículo coincide con numerosos investigadores y organismos educativos en que estas herramientas pueden servir para señalar textos que merecen una revisión más detallada, pero no deberían utilizarse como única evidencia para sancionar a un estudiante o cuestionar la autoría de un documento. La mejor práctica consiste en combinar su uso con otros métodos de evaluación, como el seguimiento del proceso de escritura, entrevistas con el autor, versiones previas del trabajo o actividades presenciales que permitan verificar el aprendizaje.

En conjunto, la prueba de Popular Science confirma que los detectores de IA siguen siendo una tecnología inmadura. Aunque han mejorado respecto a sus primeras versiones y pueden ofrecer información útil en determinados contextos, la rápida evolución de los modelos generativos hace que la carrera entre generación y detección sea cada vez más difícil. La tendencia actual apunta a que, más que confiar ciegamente en algoritmos de detección, instituciones educativas y organizaciones deberán desarrollar nuevas estrategias de evaluación y políticas de uso responsable de la inteligencia artificial.

Cómo identificar libros escritos con inteligencia artificial: señales, métodos y límites de detección

Student reading a large book with glowing scientific formulas and diagrams digitally overlaid — A student studies complex scientific equations with digital overlays in a cozy library

“Cómo identificar libros escritos con inteligencia artificial.” 2026. Más de Fondo. Accedido el 24 de junio de 2026. https://www.mardefondope.com/2026/03/identificar-libro-escrito-inteligencia-artificial.html

El creciente problema de la detección de libros escritos total o parcialmente con inteligencia artificial, en un contexto en el que la producción de textos generados por modelos como ChatGPT se ha vuelto masiva y cada vez más difícil de distinguir de la escritura humana. La preocupación central es cómo bibliotecarios, editores y lectores pueden identificar este tipo de obras sin herramientas infalibles.

a irrupción de la inteligencia artificial en el ámbito editorial ha transformado profundamente la forma de producir y distribuir libros. En la actualidad, es posible generar textos extensos en muy poco tiempo mediante herramientas capaces de imitar con gran precisión el lenguaje humano. Este fenómeno ha abierto nuevas posibilidades creativas, pero también ha generado una preocupación creciente: cómo distinguir un libro escrito por una persona de uno producido total o parcialmente por inteligencia artificial.

El texto señala que no existe un método único y fiable para detectar con certeza un libro generado por IA. Las herramientas automáticas de detección presentan márgenes de error importantes, por lo que no pueden considerarse definitivas. En su lugar, se propone una combinación de indicios estilísticos y análisis crítico del texto.

Entre los rasgos que suelen asociarse a textos generados por IA se encuentra un lenguaje correcto pero poco expresivo, una tendencia a la repetición de ideas con formulaciones distintas y el uso frecuente de generalizaciones. Asimismo, estos textos tienden a mostrar una estructura excesivamente regular y predecible, con escasas variaciones estilísticas. En narrativa, pueden aparecer personajes poco complejos o poco memorables, así como una limitada exploración de la experiencia emocional.

Entre las señales más habituales se mencionan la excesiva uniformidad del estilo, la ausencia de variaciones personales en la voz narrativa, estructuras demasiado regulares y una tendencia a la generalización o al uso de explicaciones poco concretas. También se advierte que los textos generados por IA pueden mostrar coherencia superficial, pero carecer de profundidad experiencial o de una perspectiva verdaderamente autoral. Otro elemento relevante es la ausencia de vivencias personales o de una perspectiva situada. Mientras que la escritura humana suele incorporar huellas de experiencia, memoria o subjetividad, los textos generados por IA tienden a construir significados a partir de patrones estadísticos, lo que puede traducirse en una sensación de neutralidad o impersonalidad.

A pesar de estas diferencias, la distinción no siempre es evidente, ya que los modelos actuales han mejorado notablemente su capacidad de imitación estilística. Por ello, la lectura crítica se convierte en una herramienta fundamental. Más que buscar “errores”, se trata de evaluar la profundidad del texto, la coherencia de su voz y su capacidad para generar una experiencia significativa en el lector.

El artículo subraya además la importancia de no demonizar la IA como herramienta, ya que puede utilizarse en procesos de escritura asistida. La clave estaría en diferenciar entre obras generadas automáticamente y aquellas en las que la IA actúa como apoyo creativo, destacando la necesidad de criterios editoriales y lectura crítica para afrontar este nuevo escenario literario.

¿Son fiables los detectores de texto escrito por IA?: una evaluación sistemática sobre la fiabilidad y robustez de las herramientas de detección automática

Sun, Yicheng, Yihan Liao, and Xiaoxue Ma. “Trusting AI to Detect AI? A Systematic Evaluation of the Reliability and Robustness of Current AIGC Detection Tools for Student Academic Work.” Computers & Education (2026). Elsevier. https://doi.org/10.1016/j.compedu.2026.105456

La investigación demuestra que los actuales detectores de texto generado por inteligencia artificial presentan problemas significativos de precisión, vulnerabilidad ante modificaciones simples y riesgo elevado de falsos positivos, por lo que no deben considerarse herramientas plenamente fiables para evaluar autoría académica, abriendo un debate más amplio sobre cómo la educación debe adaptarse a la presencia estructural de la inteligencia artificial en la escritura y el aprendizaje.

El estudio analiza uno de los debates más relevantes en el ámbito educativo contemporáneo: hasta qué punto pueden considerarse fiables las herramientas de inteligencia artificial diseñadas para detectar contenidos producidos por otros sistemas de IA generativa, especialmente en contextos académicos donde universidades, escuelas y docentes buscan identificar si un trabajo ha sido elaborado por estudiantes o generado parcial o totalmente mediante modelos como OpenAI ChatGPT, asistentes de escritura automatizada o generadores de texto similares. La investigación parte de una preocupación creciente: mientras las instituciones educativas adoptan detectores automáticos para preservar la integridad académica, todavía existe poca evidencia científica sólida acerca de la precisión real de estos sistemas y de sus limitaciones metodológicas.

Los autores realizaron una evaluación sistemática y comparativa de múltiples detectores de contenido generado por IA (AIGC detectors, Artificial Intelligence Generated Content detectors), sometiéndolos a pruebas extensivas con diferentes tipos de textos académicos producidos tanto por humanos como por sistemas de lenguaje avanzados. El objetivo era medir dos dimensiones fundamentales: la fiabilidad, entendida como la capacidad del sistema para clasificar correctamente un texto, y la robustez, es decir, la resistencia del detector frente a modificaciones o manipulaciones deliberadas destinadas a engañar al algoritmo. Los resultados muestran que muchas herramientas presentan inconsistencias importantes y no ofrecen un nivel de precisión suficientemente estable como para convertirse en un criterio único de evaluación académica.

Uno de los hallazgos más significativos es que numerosos detectores funcionan razonablemente bien cuando analizan textos generados directamente por modelos de lenguaje sin edición posterior, pero su rendimiento cae de manera drástica cuando el contenido es ligeramente modificado por una persona. Cambios mínimos como reformular frases, alterar el orden sintáctico, introducir expresiones más personales o corregir ciertos patrones lingüísticos pueden reducir notablemente la capacidad del sistema para identificar el origen artificial del texto. Esto revela que la mayoría de detectores dependen de patrones estadísticos superficiales relacionados con la predictibilidad léxica y la regularidad sintáctica, en lugar de comprender realmente la autoría del contenido.

La investigación también advierte sobre el problema inverso: los falsos positivos. En numerosas pruebas, textos completamente redactados por humanos fueron clasificados erróneamente como producidos por inteligencia artificial. Este aspecto resulta especialmente preocupante en contextos universitarios, ya que una detección incorrecta puede derivar en acusaciones injustas de fraude académico, cuestionamiento de la honestidad del estudiante o procedimientos disciplinarios basados en evidencia técnicamente poco fiable. El estudio subraya que confiar excesivamente en estas herramientas puede generar problemas éticos y legales, particularmente cuando las instituciones utilizan resultados automatizados como prueba concluyente en procesos de evaluación.

Otro aspecto analizado es la evolución constante de los grandes modelos lingüísticos (LLM, Large Language Models). Herramientas de detección entrenadas para reconocer patrones asociados a versiones anteriores de modelos como ChatGPT ChatGPT, Anthropic Claude o sistemas similares pueden volverse rápidamente obsoletas cuando aparecen modelos más sofisticados capaces de producir lenguaje cada vez más cercano a la escritura humana natural. Esto genera una especie de carrera tecnológica permanente: conforme mejoran los generadores de texto, los detectores deben actualizarse continuamente, aunque sin garantía de alcanzar precisión duradera.

El estudio examina además estrategias conocidas como evasión adversarial, es decir, técnicas intencionadas utilizadas para burlar detectores automáticos. Entre ellas se incluyen la paráfrasis automática, traducción múltiple entre idiomas, edición humana posterior, reformulación mediante otros modelos lingüísticos e incluso la mezcla de fragmentos humanos con contenido generado por IA. Los resultados demuestran que muchos detectores pierden efectividad frente a estas intervenciones relativamente simples, lo que pone en duda su utilidad práctica en escenarios reales donde un usuario busca deliberadamente evitar la detección.

Desde una perspectiva educativa, los investigadores plantean una reflexión importante: el problema no puede abordarse únicamente desde la lógica policial o punitiva. La expansión de herramientas generativas obliga a repensar los sistemas tradicionales de evaluación académica. Si resulta cada vez más difícil distinguir entre producción humana y producción asistida por IA, las universidades deben reconsiderar qué significa realmente aprender, escribir, investigar y demostrar competencias intelectuales en un entorno donde la inteligencia artificial forma parte habitual del proceso de trabajo. En lugar de centrarse exclusivamente en detectar fraude, el sistema educativo debería avanzar hacia modelos pedagógicos que integren críticamente la IA, enseñando al alumnado a utilizarla de manera ética, transparente y reflexiva.

Los autores concluyen que, aunque los detectores automáticos pueden servir como herramientas auxiliares dentro de procesos más amplios de evaluación, actualmente no ofrecen suficiente precisión, consistencia ni robustez como para convertirse en árbitros definitivos de la autenticidad académica. Recomiendan que cualquier institución educativa evite depender exclusivamente de sistemas automáticos y combine su uso con revisión humana, análisis contextual del trabajo, conocimiento previo del estilo del estudiante y nuevas estrategias pedagógicas orientadas a la alfabetización crítica en inteligencia artificial.

En términos más amplios, el estudio pone de relieve una paradoja tecnológica cada vez más evidente: se está utilizando inteligencia artificial para detectar inteligencia artificial, pero ambos sistemas evolucionan simultáneamente en una dinámica competitiva donde los mecanismos de control van siempre un paso detrás de las capacidades generativas. Esto plantea preguntas profundas no solo sobre integridad académica, sino sobre confianza, autoría intelectual y el futuro mismo de la producción del conocimiento en la era algorítmica

Bibliochecker: una herramienta para detectar alucinaciones de IA en referencias bibliográficas

Bibliochecker – Verificador de Referencias Bibliográficas por Alex Chinchilla

https://alexescazu24-ship-it.github.io/verificador-referencias2026.2

Bibliochecker ejemplifica cómo las nuevas herramientas de verificación automatizada pueden convertirse en aliadas estratégicas para preservar la integridad académica frente a los errores y alucinaciones producidas por la inteligencia artificial generativa.

En un contexto académico marcado por el uso creciente de sistemas de inteligencia artificial generativa como ChatGPT, Gemini o Claude, una de las preocupaciones más relevantes dentro de la investigación científica es la proliferación de “alucinaciones bibliográficas”, es decir, referencias inventadas o parcialmente incorrectas que los modelos generan al construir citas aparentemente plausibles pero inexistentes. Frente a este problema surge Bibliochecker, una herramienta web diseñada específicamente para verificar la autenticidad y consistencia de referencias bibliográficas generadas o asistidas por inteligencia artificial.

Bibliochecker se presenta como una aplicación accesible directamente desde el navegador, sin necesidad de instalación ni registro, lo que facilita su uso inmediato por parte de investigadores, estudiantes, bibliotecarios, editores científicos y revisores académicos. Su objetivo principal consiste en detectar posibles errores, inconsistencias o invenciones en listas bibliográficas, especialmente aquellas elaboradas mediante herramientas de IA. La plataforma automatiza la verificación cruzando la información proporcionada con bases de datos académicas consolidadas como CrossRef, Semantic Scholar y OpenAlex, lo que permite comprobar la existencia real de un documento, validar identificadores DOI y contrastar la coherencia entre título, autoría y fecha de publicación.

Una de sus fortalezas radica en la flexibilidad del ingreso de datos. El usuario puede introducir referencias de tres formas distintas: pegando directamente texto copiado desde documentos Word o PDF, cargando archivos en formato .docx que contengan exclusivamente la sección bibliográfica o utilizando ejemplos predeterminados para familiarizarse con el funcionamiento del sistema. La herramienta identifica automáticamente cada referencia incluso cuando estas aparecen en texto corrido o sin separación entre líneas, aplicando patrones inspirados en la normativa APA 7 para detectar estructuras bibliográficas.

El sistema permite activar distintos módulos de comprobación según las necesidades del usuario. El módulo de CrossRef verifica en tiempo real la validez del DOI y compara metadatos asociados; Semantic Scholar realiza búsquedas por similitud textual del título y verifica autoría y año; OpenAlex consulta su base académica abierta para confirmar coincidencias; mientras que un verificador específico examina si la referencia cumple con requisitos formales del estilo APA 7, revisando aspectos como el formato de autores, la correcta ubicación del año entre paréntesis, el uso de puntuación normativa o la presencia obligatoria del DOI en artículos científicos. Además, el sistema incorpora enlaces a Google Scholar para facilitar comprobaciones manuales complementarias.

Cada referencia analizada recibe un diagnóstico estructurado en cuatro categorías claramente diferenciadas. La categoría “Válida” indica que la obra fue localizada en las bases de datos sin inconsistencias detectadas. La categoría “Sospechosa” señala discrepancias parciales, como diferencias entre nombres de autores, títulos ligeramente distintos o inconsistencias cronológicas. La categoría “Problema” representa casos más graves, donde el DOI no existe o el documento no aparece en ninguna base académica consultada, sugiriendo una alta probabilidad de invención o error generado por IA. Finalmente, el estado “Sin DOI” identifica referencias donde no ha sido posible realizar validación automática mediante identificadores persistentes, algo frecuente en libros, tesis o documentos no indexados formalmente.

Otro elemento destacable es la posibilidad de exportar un reporte completo en formato HTML, generando una tabla estructurada con todos los resultados obtenidos. Este informe puede compartirse, archivarse o imprimirse, facilitando procesos editoriales, revisión académica o auditoría bibliográfica previa a la publicación de artículos científicos. La herramienta también incorpora distintos modos visuales —oscuro, claro y editorial sobrio— que mejoran la experiencia de uso en distintos contextos de trabajo.

Desde una perspectiva más amplia, Bibliochecker responde a una necesidad emergente dentro del ecosistema de la comunicación científica contemporánea: la verificación crítica de contenidos generados por inteligencia artificial. A medida que investigadores y estudiantes incorporan sistemas generativos en tareas de redacción académica, aumenta el riesgo de incluir citas falsas que comprometan la integridad científica. En este escenario, herramientas como Bibliochecker no sustituyen el criterio profesional humano, pero sí actúan como filtros preliminares de enorme valor para fortalecer la calidad documental y reducir errores antes de la difusión pública del conocimiento.

La propia plataforma insiste en una advertencia metodológica fundamental: sus resultados constituyen un apoyo automatizado y nunca un dictamen definitivo. Incluso una referencia marcada como válida puede contener errores que escapan a la detección automática, mientras que referencias catalogadas como sospechosas pueden corresponder a simples inconsistencias de metadatos o documentos no indexados en las bases consultadas. En otras palabras, Bibliochecker representa un ejemplo significativo del nuevo paradigma de colaboración entre inteligencia artificial y revisión humana experta, particularmente relevante para bibliotecas académicas, editoriales científicas y profesionales de la gestión de información digital.

¿Puede Turnitin detectar realmente la escritura generada por inteligencia artificial? Un análisis crítico sobre los límites de los detectores de IA

Diagram showing AI detector capabilities with formulaic text, generic essay, and patterned content vs. limitations like high ambiguity, new writing style, and paraphrasing — An infographic explaining what AI detectors can confidently identify and where their analysis falls short.

Atamhenwan, Lucky E. (2026). How are combinations of human-written words and LLM-generated words by ChatGPT, Copilot, Gemini and Grammarly detected by Turnitin? Education and Information Technologies. Springer Nature. DOI: 10.1007/s10639-026-14049-2

La rápida expansión de herramientas de inteligencia artificial está transformando profundamente la educación y la escritura académica. Ante este cambio, universidades e instituciones recurren cada vez más a detectores automáticos como Turnitin para identificar textos generados por IA. El estudio de Lucky E. Atamhenwan analiza hasta qué punto Turnitin puede distinguir con precisión entre escritura humana y contenido producido total o parcialmente por inteligencia artificial.

La expansión acelerada de la inteligencia artificial generativa en los últimos años ha transformado profundamente la educación superior y los procesos de producción textual. La aparición de modelos de lenguaje de gran escala como ChatGPT, Microsoft Copilot, Google Gemini y Grammarly ha permitido que estudiantes, investigadores y profesionales generen textos complejos con rapidez y una calidad lingüística cada vez más cercana a la escritura humana. Frente a este nuevo escenario, instituciones educativas de todo el mundo han comenzado a depender de sistemas automáticos de detección de contenido generado por IA, siendo Turnitin una de las herramientas más utilizadas. El estudio de Lucky E. Atamhenwan se propone analizar hasta qué punto Turnitin es realmente capaz de diferenciar entre textos escritos por humanos y textos producidos, parcial o totalmente, mediante modelos de lenguaje artificial.

La investigación parte de una cuestión central: aunque numerosas universidades están comenzando a utilizar detectores automáticos de IA para evaluar trabajos académicos, existe todavía una gran incertidumbre acerca de la precisión real de estas herramientas. El autor recuerda que la irrupción masiva de ChatGPT en noviembre de 2022 marcó un punto de inflexión sin precedentes en la relación entre inteligencia artificial y educación. En apenas unos meses aparecieron múltiples sistemas generativos capaces no solo de redactar textos completos, sino también de resumir documentos, corregir gramática, traducir contenidos, programar código y reformular ideas con notable coherencia. Este avance ha generado enormes beneficios pedagógicos, pero también ha abierto interrogantes sobre plagio, autoría y honestidad académica, especialmente cuando los estudiantes presentan como propio un contenido producido parcial o totalmente por IA.

Para estudiar la eficacia de Turnitin, el investigador diseñó un experimento de gran escala basado en 81 documentos diferentes, construidos a partir de combinaciones variables entre escritura humana y texto generado por modelos de lenguaje. Los documentos contenían mezclas progresivas que iban desde un 100% de texto humano hasta un 100% de texto generado por IA, utilizando cuatro sistemas distintos: ChatGPT, Copilot, Gemini y Grammarly. Se crearon textos de aproximadamente 4.000 palabras y se fueron introduciendo porcentajes crecientes de contenido generado artificialmente: 5%, 10%, 15%, 20%, 30%, 50%, 70%, hasta llegar al 100%. Cada documento fue sometido al detector de Turnitin para observar qué porcentaje del contenido era identificado como generado por inteligencia artificial. Este diseño experimental permitió estudiar no solamente si Turnitin detecta IA, sino también cómo cambia su comportamiento cuando el texto combina escritura humana y escritura algorítmica.

Uno de los resultados más relevantes del estudio es que Turnitin no detectó absolutamente ningún contenido generado por IA cuando este representaba solo el 5% o el 10% del texto total. Esto significa que si un estudiante escribe la mayor parte de un trabajo por sí mismo y utiliza un modelo de lenguaje únicamente para generar pequeños fragmentos, Turnitin puede no generar ninguna alerta. A partir de porcentajes cercanos al 15%, el sistema comienza a identificar contenido sospechoso, pero con un problema importante: las puntuaciones no son exactas. Cuando el porcentaje real de texto generado por IA es bajo, Turnitin suele sobreestimar la cantidad de contenido artificial, produciendo falsos incrementos. Paradójicamente, cuando el porcentaje real de IA es muy alto, el detector comienza a subestimar la presencia artificial, mostrando cifras inferiores a la realidad. Esta inconsistencia cuestiona seriamente la confianza absoluta en el sistema.

El comportamiento del detector varía además según el modelo de lenguaje utilizado. En el caso de ChatGPT, Turnitin mostró una tendencia sistemática a detectar porcentajes inferiores al contenido real generado por IA. Incluso cuando un texto estaba producido al 100% por ChatGPT, Turnitin solo identificó un 60% como artificial. Con Copilot y Gemini los resultados fueron algo más equilibrados, aunque igualmente inconsistentes: en algunos casos sobreestimaban la presencia de IA y en otros la reducían. Grammarly presentó un patrón diferente, con detecciones superiores al porcentaje real cuando la intervención de IA era baja, pero subestimaciones cuando aumentaba la proporción de texto generado automáticamente. Esto demuestra que no existe un criterio homogéneo y que el detector responde de manera distinta según las características lingüísticas propias de cada modelo de inteligencia artificial.

Un segundo bloque del estudio analiza un fenómeno cada vez más extendido: el uso de herramientas diseñadas específicamente para “humanizar” textos creados por IA con el objetivo de evitar ser detectados. Para ello se utilizaron plataformas como QuillBot, EasyEssayAI y RyneAI, muy conocidas en comunidades digitales por su capacidad para reformular textos y hacerlos parecer escritos por humanos. Los investigadores tomaron textos generados al 100% por ChatGPT, Copilot, Gemini y Grammarly, y posteriormente los pasaron por estas herramientas de reformulación antes de volver a analizarlos en Turnitin. Los resultados fueron especialmente reveladores: textos completamente generados por Copilot y posteriormente reformulados con QuillBot obtuvieron una puntuación del 0%, es decir, Turnitin los consideró completamente humanos. De manera similar, RyneAI consiguió que textos enteramente generados por Copilot, Gemini o Grammarly fueran clasificados también con 0% de contenido artificial.

Desde un punto de vista estadístico, el estudio confirma que existe una correlación muy fuerte entre la cantidad real de texto generado por IA y la puntuación otorgada por Turnitin. Sin embargo, esta relación no implica precisión. Los análisis de correlación y regresión muestran que el sistema detecta patrones asociados al texto artificial, pero no logra cuantificar de manera fiable cuánto contenido ha sido realmente producido por inteligencia artificial. El modelo estadístico utilizado revela que el 82,5% de la variabilidad observada en las puntuaciones depende efectivamente de la presencia de texto generado por IA, pero el margen de error sigue siendo considerable. En otras palabras: Turnitin reconoce señales asociadas al uso de IA, pero no constituye una herramienta exacta para determinar porcentajes reales de autoría algorítmica.

Las implicaciones educativas del trabajo son profundas. El autor sostiene que las universidades no deberían utilizar las puntuaciones de Turnitin como prueba concluyente para sancionar estudiantes, especialmente cuando los porcentajes detectados son bajos o moderados. Según el estudio, puntuaciones inferiores al 40% deben interpretarse con gran cautela, mientras que valores superiores al 60% pueden ser indicativos más sólidos, aunque nunca definitivos. Más allá de la detección, el artículo plantea que el verdadero desafío no consiste en prohibir la inteligencia artificial, sino en redefinir el modo en que se evalúa el aprendizaje. A medida que los modelos generativos evolucionen, será cada vez más difícil impedir su uso en tareas escritas tradicionales. Esto obliga a replantear metodologías de evaluación, incorporando sistemas supervisados, navegadores bloqueados, evaluaciones presenciales y nuevas formas de demostrar conocimiento que no dependan exclusivamente de la producción textual.

El estudio concluye que la educación necesita abandonar la visión puramente punitiva sobre la inteligencia artificial y avanzar hacia un modelo de integración ética y transparente. La IA debe entenderse como una herramienta legítima de aprendizaje, siempre que existan normas claras sobre su uso. El autor propone una cooperación entre universidades, empresas tecnológicas y plataformas como Turnitin para desarrollar sistemas que no solo detecten contenido generado por IA, sino que permitan rastrear el origen y el proceso de creación de los textos. En definitiva, esta investigación desmonta la idea de que los detectores actuales sean infalibles y muestra que, en el contexto actual, confiar ciegamente en estas herramientas para tomar decisiones académicas puede generar errores, injusticias y conflictos éticos considerables. Más que una solución definitiva, los detectores de IA representan apenas una tecnología en desarrollo dentro de un escenario educativo que está cambiando a una velocidad sin precedentes.

Datos clave:

Precisión con textos humanos: Turnitin no arrojó falsos positivos en el texto escrito completamente por humanos (0% de puntuación de IA).
Umbral mínimo de detección: Turnitin no detectó la presencia de IA cuando el porcentaje real de texto generado por los LLM era del 5% o 10% (marcando 0% en la puntuación).
Distorsión en porcentajes bajos (Inexactitud por exceso): Cuando la cantidad de IA era baja pero detectable (ej. 15% o 20%), Turnitin tendió a sobreestimar el puntaje, otorgando porcentajes de IA detectada más altos que la realidad (ej. detectó entre 21% y 24% para un 15% real).
Distorsión en porcentajes altos (Inexactitud por defecto): A medida que aumentaba el texto de IA en la combinación, el detector tendió a subestimar el puntaje real. Al llegar al 100% de contenido de IA en textos largos (4,000 palabras), Turnitin nunca puntuó 100%; las calificaciones máximas para textos puros de IA fueron de 87% (Copilot/Gemini), 82% (Grammarly) y apenas un 60% (ChatGPT).
Correlación: Existe una relación positiva muy fuerte ($R^2$ de Nagelkerke = 0.825): a mayor porcentaje real de IA, mayor es la puntuación de detección de Turnitin, confirmando que la detección se debe efectivamente a los fragmentos de IA
ChatGPT: Fue el modelo que más «burló» el detector en formato mixto. Turnitin puntuó por debajo de la realidad en el 65% de sus textos. Incluso al 25% de contenido real de ChatGPT, Turnitin marcó 0%.
Copilot y Gemini: Siguieron un comportamiento similar entre sí; Turnitin tendió a sobreestimar el porcentaje de IA en rangos bajos y medianos, pero empezó a reportar por debajo de la realidad a partir del 75% de contenido de IA.
Grammarly: Turnitin detectó niveles inflados (más altos que la realidad) entre el 15% y 40% de contenido, pero empezó a puntuar por debajo del porcentaje real a partir del 45% de texto generado por Grammarly.
RyneAI: Fue la herramienta de evasión más efectiva. Logró reducir la puntuación de Turnitin a 0% para Copilot, Grammarly y Gemini (haciendo que el detector los aceptara por completo como humanos). Para ChatGPT, la redujo al 26%.
QuillBot (AI Humanizer): Consiguió reducir la puntuación de Copilot a 0%. Sin embargo, fue menos efectivo con los demás: ChatGPT (33%), Grammarly (62%) y Gemini (83%).
EasyessayAI: Fue la menos efectiva. Turnitin siguió detectando altas tasas de IA en los textos procesados: Copilot (80%), ChatGPT (65%), Gemini (63%) y Grammarly (56%).
Efecto de la longitud del texto: El estudio demostró que Turnitin es mucho más preciso detectando textos puramente de IA cuando el documento es más corto (500-1000 palabras frente a las 4000 de la primera fase).

¿Se puede reconocer un texto escrito por IA? La intuición humana frente a los detectores automáticos

Vara, Vauhini. “How to Tell AI Writing.” The Atlantic, mayo de 2026. Disponible en: The Atlantic

Se analiza una cuestión cada vez más relevante: si realmente es posible identificar cuándo un texto ha sido escrito por inteligencia artificial. La autora parte de una constatación evidente: a medida que los modelos lingüísticos mejoran, los métodos tradicionales de detección resultan menos fiables. Los detectores automáticos producen numerosos falsos positivos y falsos negativos, lo que dificulta establecer con certeza el origen de un texto.

En las encuestas, la gente afirma de forma consistente que desconfía de los textos generados por IA. Sin embargo, eso no ha impedido que cada vez más personas la utilicen en la vida cotidiana: para redactar correos de trabajo y mensajes personales, elaborar listas de la compra o incluso escribir guiones para discutir con sus parejas. La escritura generada por IA también se está infiltrando en los espacios literarios más prestigiosos: secciones de opinión de periódicos, libros y revistas literarias. Estos textos son perfectamente limpios, sin una coma fuera de lugar; de extensión uniforme, con párrafos equilibrados y un tono característico que resulta al mismo tiempo desenfadado y grandilocuente.

La capacidad de la IA para producir textos fluidos y gramaticalmente correctos resulta irresistible, ya sea para redactar una frase ingeniosa en una solicitud de empleo o una ocurrencia para una aplicación de citas. Los textos generados por IA pueden engañar fácilmente a los lectores, especialmente cuando estos solo leen por encima. El resultado es una perfección prefabricada: textos que no pueden discutirse realmente porque carecen de un proceso deliberativo subyacente. Aunque parezcan plausibles a primera vista, un análisis más profundo revela que todo está ligeramente desajustado: el tono es plano, algunas palabras resultan extrañas, la estructura carece de lógica, faltan partes esenciales del argumento y abundan los errores fácticos. Incluso existen tutoriales para eliminar de la escritura las señales que delatan el uso de IA: evitar los guiones largos, los dos puntos o las ya sospechosas construcciones del tipo «No es X; es Y». Para la autora, ese es precisamente el problema fundamental de la escritura generada por IA: bajo una superficie pulida y convincente, a menudo no existe un razonamiento auténtico.

Un estudio realizado por investigadores de la Universidad de Stanford y la Universidad Carnegie Mellon encontró que los principales modelos de IA respaldan las ideas de sus usuarios un 49 % más que los seres humanos durante una conversación. Además, los participantes valoraban las respuestas más complacientes como de mayor calidad y afirmaban que esa actitud aumentaba la probabilidad de volver a utilizar la IA. Según la autora, este tipo de comunicación está empezando a rodearnos por todas partes. Su expansión parece inevitable. Incluso quienes no utilizan IA comenzarán a parecerse a ella en su manera de expresarse. Un estudio preliminar del Instituto Max Planck para el Desarrollo Humano encontró que, en conversaciones espontáneas como las de los pódcast, las personas ya muestran un aumento apreciable en el uso de palabras que ChatGPT genera con frecuencia, como delve («profundizar»), comprehend («comprender»), boast («presumir»), swift («rápido») o meticulous («meticuloso»).

Vara sostiene que muchas personas que utilizan habitualmente herramientas como ChatGPT desarrollan una especie de «instinto» para reconocer ciertos patrones característicos de la escritura generada por IA. No se trata de una prueba científica, sino de una percepción basada en la experiencia acumulada tras leer grandes cantidades de contenido producido por estos sistemas. Entre los indicios más frecuentes se encuentran una estructura excesivamente ordenada, transiciones demasiado fluidas entre párrafos y una tendencia a resumir constantemente las ideas ya expuestas.

También se cuestiona algunos de los supuestos signos distintivos que suelen mencionarse en internet. Elementos como el uso de determinados signos de puntuación, ciertas palabras de moda o expresiones recurrentes pueden aparecer igualmente en textos humanos. Por ello, la autora advierte contra la tentación de convertir cualquier rasgo estilístico en una prueba definitiva de autoría artificial. Lo relevante no es un único indicador, sino la acumulación simultánea de varios patrones.

Otro aspecto importante es la progresiva normalización de la escritura asistida por IA. Cada vez más autores emplean estas herramientas para revisar, reorganizar o mejorar borradores propios. Esta situación difumina la frontera entre texto humano y texto artificial, haciendo que la pregunta ya no sea únicamente quién escribió un texto, sino en qué medida intervino la inteligencia artificial en su elaboración.

El artículo también plantea una reflexión cultural más amplia. La proliferación de contenidos generados por IA está modificando nuestra percepción de la autenticidad y de la autoría. La sensación de que «algo suena a ChatGPT» se está convirtiendo en una nueva forma de alfabetización digital, basada más en la experiencia lectora que en herramientas tecnológicas. Sin embargo, la autora concluye que, conforme los modelos continúen evolucionando, incluso esa intuición humana podría perder eficacia, obligándonos a replantear cómo valoramos la originalidad y la creatividad en la era de la inteligencia artificial.

Escribir bajo sospecha: el impacto de los detectores de inteligencia artificial en estudiantes y docentes

Agranovsky, Nathan. 2026. “AI Detectors Are Failing Our Students.” The AI School Librarian (Substack), 13 de abril de 2026. https://aischoollibrarian.substack.com/p/ai-detectors-are-failing-our-students

El artículo analiza críticamente el uso creciente de detectores de inteligencia artificial en entornos educativos y sostiene que estas herramientas, lejos de resolver el problema del uso indebido de la IA, están generando nuevos efectos adversos en el aprendizaje y la evaluación.

Un estudio reciente, AI Writing Detectors Are Ineffective, Unreliable, and Harmful de Louie Giray, reúne evidencias crecientes y plantea una idea clara: los detectores de escritura con IA no son lo bastante fiables para ser usados en la toma de decisiones educativas, y utilizarlos así puede causar un daño real al alumnado.

En particular, se señala que los estudiantes no nativos de inglés son desproporcionadamente afectados por estas herramientas, ya que sus producciones escritas tienden a ser más estructuradas o menos idiomáticas, lo que los algoritmos interpretan erróneamente como patrones artificiales. Este fenómeno no constituye un simple margen de error aceptable, sino un problema estructural que compromete la equidad del sistema de evaluación.

En primer lugar, se argumenta que los detectores de IA no identifican realmente la autoría del texto, sino que funcionan mediante métricas probabilísticas como la perplejidad y la variabilidad de las frases, lo que los hace incapaces de distinguir de forma fiable entre un texto humano bien estructurado y uno generado por IA. Esto provoca un alto riesgo de falsos positivos, especialmente en estudiantes que escriben con estilo académico, siguen rúbricas estrictas o pertenecen a contextos multilingües.

Otro aspecto crítico que se aborda es la facilidad con la que estos sistemas pueden ser eludidos. El artículo señala que no se requieren conocimientos técnicos avanzados para modificar un texto generado por IA de forma que evite ser detectado. Cambios mínimos en la redacción, ajustes de tono o la combinación parcial de escritura humana y artificial pueden alterar significativamente los resultados del detector. Esto genera una situación paradójica: mientras algunos estudiantes pueden ser falsamente acusados sin haber utilizado IA, otros pueden emplearla de manera estratégica sin ser detectados, lo que introduce una profunda desigualdad en el sistema de evaluación.

Se dedica una parte importante al problema del sesgo, destacando que los detectores tienden a perjudicar especialmente a estudiantes multilingües o a aquellos que utilizan un lenguaje más simple o estructurado. Esta situación agrava desigualdades ya existentes en el sistema educativo, ya que estudiantes que están en proceso de adquisición de una lengua o que provienen de contextos educativos diversos tienen más probabilidades de ser señalados erróneamente. De este modo, la herramienta no solo falla en su precisión técnica, sino que también introduce un componente de injusticia sistemática.

El texto también señala que estas herramientas están alterando el comportamiento de los estudiantes, que empiezan a escribir “para el detector” en lugar de escribir para comunicar ideas. Esto conduce a una degradación del estilo, una mayor homogeneización del lenguaje y, en algunos casos, al uso defensivo de la IA para evitar ser penalizados injustamente.

Otro eje central del artículo es la dimensión ética y pedagógica: el uso de detectores desplaza la confianza del profesorado hacia sistemas opacos que no pueden demostrar autoría ni intención. Incluso los propios desarrolladores de estas herramientas reconocen su falta de fiabilidad, lo que cuestiona su uso como base para sanciones académicas.

A partir de ejemplos concretos, el artículo ilustra la situación habitual en muchas aulas: un estudiante entrega un trabajo, el sistema lo marca como generado en gran parte por IA, y el docente debe decidir si confiar en la herramienta o en la palabra del estudiante, especialmente cuando no existen borradores u ուրիշ trazas del proceso de escritura. Este tipo de dilemas refleja una tensión creciente en la educación contemporánea, donde la autoridad del algoritmo compite con la evidencia humana sin que exista un criterio claro para resolver el conflicto.

Finalmente, el autor propone un cambio de enfoque: en lugar de depender de la detección, las instituciones deberían centrarse en la alfabetización en IA, la evaluación del proceso de escritura y la adaptación de las metodologías docentes a un entorno donde la IA ya forma parte del ecosistema de aprendizaje.

Un relato premiado en un certamen literario internacional podría haber sido generado total o parcialmente por inteligencia artificial

Bransford, Nathan. 2026. “A Literary A.I. Scandal Arrives: This Week in Books.” Nathan Bransford Blog, mayo de 2026. https://nathanbransford.com/blog/2026/05/a-literary-a-i-scandal-arrives-this-week-in-books

El artículo de Nathan Bransford aborda un caso que ha sacudido al mundo editorial: la sospecha de que un relato premiado en un certamen literario internacional podría haber sido generado total o parcialmente por inteligencia artificial. Este hecho ha encendido las alarmas en el sector cultural, no tanto por un caso aislado, sino por lo que representa como síntoma de una transformación más profunda en la literatura contemporánea.

Un relato escrito por una persona que se declara entusiasta de la IA, con todas las huellas típicas de escritura generada por IA, ganó un prestigioso premio de Granta. Esto, como era de esperar, está generando una gran cantidad de lamentos y preocupaciones en el mundo de la escritura. El texto se centra en la controversia en torno al relato The Serpent in the Grove, cuya calidad estilística y ciertos patrones narrativos han despertado dudas entre críticos y lectores. Elementos como repeticiones estructurales, metáforas excesivamente pulidas o una uniformidad estilística inusual han alimentado la hipótesis de una posible autoría algorítmica. El problema de fondo, subraya el artículo, es que no existen herramientas fiables para distinguir con certeza entre escritura humana y texto generado por IA, lo que deja a los concursos literarios en una posición extremadamente vulnerable.

Bransford insiste en que este caso expone una grieta estructural en el sistema de validación literaria: la confianza. Los jurados trabajan bajo la presunción de autenticidad del autor, pero esa base empieza a resquebrajarse en un contexto donde los modelos de lenguaje pueden producir narrativas sofisticadas en segundos. Incluso los sistemas de detección de IA ofrecen resultados contradictorios, lo que agrava la incertidumbre y abre la puerta a controversias difíciles de resolver.

En ausencia de herramientas fiables de detección de IA y de pruebas de culpabilidad, la autora considera que se tiene más que temer de las cacerías de brujas impulsadas por la IA y de las falsas acusaciones (que afectarán de manera desproporcionada a escritores idiosincráticos y ya marginados) que del uso de la IA por parte de los escritores, incluso cuando se utilice de forma integral.

El artículo también amplía la discusión hacia el impacto cultural más amplio de la inteligencia artificial en la escritura. La literatura, tradicionalmente considerada una de las formas más humanas de expresión creativa, se enfrenta ahora a una tecnología capaz de imitar estilos, voces y emociones con una precisión creciente. Esto genera una crisis de identidad en el mundo literario: ¿qué significa ser autor en la era de la IA?

Bransford sugiere que este episodio no será un caso aislado, sino el inicio de una serie de conflictos similares en premios, editoriales y plataformas de publicación. La frontera entre creación humana y producción algorítmica se vuelve cada vez más difusa, y con ella se tambalea uno de los pilares fundamentales de la cultura escrita: la autenticidad.

Inteligencia artificial vs. inteligencia artificial: herramientas de detección aplicadas a la evaluación educativa

Durán Benavides, Arturo, Claudia Rita Estrada Esquivel y Karen Quintero Álvarez. “Inteligencia artificial vs. inteligencia artificial: herramientas de detección aplicadas a la evaluación educativa.” En Inteligencia artificial: experiencias y reflexiones sobre la investigación educativa, editado por Alexandro Escudero-Nahón y Emma Patricia López, 2026. https://doi.org/10.56162/transdigitalbc13.29

Capítulo PDF

La detección de contenidos generados por IA no puede abordarse exclusivamente desde la tecnología. Aunque las herramientas actuales son útiles, su fiabilidad es limitada y no sustituyen el juicio crítico del docente. El verdadero reto reside en redefinir la evaluación educativa, pasando de un enfoque punitivo basado en la detección a un modelo formativo que promueva la ética, el pensamiento crítico y el uso responsable de la inteligencia artificial.

La incorporación de la inteligencia artificial generativa (IAG) en la educación ha supuesto una transformación profunda tanto en la producción académica como en los sistemas de evaluación. Más allá de una simple innovación tecnológica, se trata de un cambio pedagógico que obliga a replantear el papel del docente y los mecanismos tradicionales de verificación de la autoría. El uso generalizado de herramientas como ChatGPT ha intensificado las preocupaciones sobre el plagio y la deshonestidad intelectual, introduciendo nuevas formas de generación automatizada de textos que amplían el concepto clásico de copia.

En paralelo, diversos autores advierten que el uso excesivo de estas herramientas puede afectar negativamente al desarrollo del pensamiento crítico y la metacognición. Al ofrecer respuestas inmediatas y elaboradas, la IAG reduce la necesidad de análisis autónomo, lo que puede derivar en una dependencia tecnológica y en una pérdida de habilidades fundamentales para el aprendizaje profundo. Esto obliga a las instituciones a redefinir el concepto de plagio y a formar al alumnado en un uso ético y consciente de estas tecnologías.

Ante este escenario, han surgido herramientas de detección de contenido generado por IA, como Turnitin y Copyleaks, que emplean modelos estadísticos, lingüísticos y de aprendizaje automático para identificar patrones de escritura. Sin embargo, su eficacia es limitada: presentan márgenes de error significativos, especialmente frente a modelos generativos más avanzados, y existe un riesgo relevante de falsos positivos que puede derivar en acusaciones injustas. Además, las estrategias de evasión —como el parafraseo, la traducción o la manipulación textual— dificultan aún más la detección fiable.

Los resultados del estudio muestran que, aunque la IA ofrece oportunidades de personalización y mejora del aprendizaje, también incrementa prácticas deshonestas si no se regula adecuadamente. En este sentido, el problema no puede resolverse únicamente mediante herramientas tecnológicas, sino que exige una transformación de los modelos de evaluación hacia enfoques más auténticos, centrados en procesos, reflexión y participación activa del estudiante.

Desde una perspectiva pedagógica, se propone combinar el uso de la IA con estrategias evaluativas más complejas, como exámenes orales, proyectos colaborativos o actividades que valoren el proceso de aprendizaje. Asimismo, se subraya la importancia de la formación docente en inteligencia artificial y ética digital, ya que el profesorado debe estar preparado para integrar estas herramientas sin perder el control sobre la evaluación y el acompañamiento educativo.

En cuanto a las perspectivas futuras, destaca el desarrollo de la inteligencia artificial explicativa (XAI), orientada a hacer comprensibles los procesos de decisión de los sistemas automatizados. Esta línea permite avanzar hacia una evaluación más transparente y formativa, donde no solo importe el resultado, sino también la comprensión del proceso. Paralelamente, se señala la necesidad urgente de marcos normativos claros que regulen el uso de la IA en educación, como ya ocurre en la Unión Europea, frente a contextos donde aún existe un vacío legal.

La señal principal de que podrías estar viendo un video generado por IA

Germain, Thomas. “The Number One Sign You Might Be Watching an AI Video.” BBC Future, 31 octubre 2025. https://www.bbc.com/future/article/20251031-the-number-one-sign-you-might-be-watching-ai-video

La detección de videos generados o manipulados por inteligencia artificial (IA) en un entorno en el que estas tecnologías se han vuelto extremadamente sofisticadas y aún más difíciles de distinguir del material real. Su tesis central es que, aunque las herramientas de IA continúan mejorando, todavía existen ciertos indicadores confiables que pueden ayudar a identificar contenido sintético —siempre y cuando los espectadores sepan qué observar.

El autor introduce la idea de que los avances recientes en generación de video mediante IA han erosionado nuestra confianza tradicional en las imágenes como prueba de realidad: “Lo que parece real ya no es garantía de autenticidad”. En este contexto, advierte que la audiencia probablemente será engañada repetidamente con videos falsos antes de que llegue a cuestionar sistemáticamente todo lo que ve.

El artículo presenta la opinión de Hany Farid, profesor de ciencias de la computación en la Universidad de California, Berkeley y pionero en el estudio forense de medios digitales. Farid destaca que el aspecto más revelador de un video generado por IA, en muchos casos, es su calidad visual: los materiales sintéticos suelen exhibir baja resolución, imágenes borrosas o apariencia “grumosa” que se asemeja a grabaciones de muy mala calidad. Esta característica se vuelve particularmente evidente en clips que emulan estilo doméstico o de “found footage”, como cámaras de seguridad o grabaciones improvisadas, donde la compresión y los artefactos introducidos para ocultar imperfecciones pueden ser un signo de síntesis.

Germain también explora cómo los generadores de video por IA deliberadamente reducen la calidad de imagen como técnica para ocultar artefactos o fallos, lo cual puede ser paradójicamente una pista de que el contenido no proviene de una cámara real. La lógica detrás de este fenómeno es que las imperfecciones artificiales se camuflan mejor en clips de mala calidad que en aquellos nítidos y bien definidos: cuando un video parece demasiado familiar o responde a patrones genéricos sin una procedencia clara, esto debería activar las alertas del espectador.

El artículo contextualiza la discusión dentro de un panorama en el que las tecnologías de generación de video han alcanzado tal nivel que incluso expertos pueden ser engañados si no se presta atención a señales sutiles o a la procedencia del material. Este análisis forma parte de un esfuerzo más amplio por promover una alfabetización mediática crítica: es decir, la capacidad de evaluar no solo la calidad visual, sino también la fuente, la metadata disponible y el contexto en que aparece un video antes de aceptarlo como genuino.

Aunque no existe un método infalible para detectar todo video generado por IA, la principal señal —imágenes con mala calidad o artefactos visuales contradictorios con la supuesta fuente del video— ofrece un punto de partida valioso para discernir contenido potencialmente sintético en la era de los deepfakes avanzados.

	¿Es el artículo cien… en OpenEval: la inteligencia arti…
	¿Es el artículo cien… en PaperOrchestra: cuando la inte…
	ATHENEA EGEA AHIJADO en Supuestos prácticos de oposici…
	Noticias IA y Educac… en Aprender para el futuro: educa…
	IA en bibliotecas: d… en Implementación de un chatbot d…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca