Archivo de la etiqueta: Detectores

¿Son fiables los detectores de texto generado por Inteligencia artificial?

Hines, Kristi. «Should You Trust An AI Detector?» Search Engine Journal, 18 de julio de 2023. https://www.searchenginejournal.com/should-you-trust-an-ai-detector/491949/.

La IA generativa está ganando terreno y se está utilizando cada vez más para crear diversos tipos de contenidos, como texto, imágenes, música y más. Esto ha llevado a una creciente preocupación sobre la fiabilidad de los detectores de IA para discernir entre contenidos generados por humanos y aquellos creados por algoritmos de inteligencia artificial. Turnitin resultó ser la herramienta más precisa en todos los enfoques, seguida de Compilatio y GPT-2 Output Detector.

Detectar y verificar si un contenido fue generado por una IA o por un ser humano es un desafío en constante evolución. A medida que la tecnología de IA avanza, también lo hacen las técnicas para ocultar la autoría de los contenidos generados por algoritmos. Esto puede plantear problemas en términos de veracidad, credibilidad y confiabilidad de la información que se comparte en línea. Para abordar esta preocupación, se han llevado a cabo diversos estudios para evaluar la eficacia de las herramientas de detección de IA en esta tarea. Estos estudios buscan mejorar y perfeccionar los algoritmos de detección y establecer métricas para evaluar su precisión.

Algunos enfoques utilizan marcadores específicos que pueden identificar ciertas características o patrones que son más comunes en contenidos generados por IA. Otros enfoques buscan analizar el estilo y la estructura de los textos o imágenes para identificar indicios de automatización.

¿Son parciales los detectores de IA? Los investigadores encontraron que los detectores de contenidos de IA, especialmente aquellos diseñados para identificar contenidos generados por modelos de lenguaje como GPT, pueden presentar un sesgo significativo en contra de los escritores no nativos de inglés. El estudio descubrió que estos detectores, diseñados para diferenciar entre contenidos generados por IA y contenidos generados por humanos, clasifican erróneamente muestras de escritura en inglés no nativo como generadas por IA, mientras que identifican con precisión muestras de escritura en inglés nativo.

Utilizando muestras de escritura de escritores nativos y no nativos, los investigadores descubrieron que los detectores clasificaban erróneamente más de la mitad de estas últimas muestras como generadas por IA. Los resultados sugieren que los detectores de GPT pueden penalizar involuntariamente a los escritores con expresiones lingüísticas limitadas, lo que subraya la necesidad de prestar más atención a la equidad y solidez de estas herramientas. Esto podría tener implicaciones significativas, sobre todo en contextos evaluativos o educativos, donde los hablantes no nativos de inglés podrían verse inadvertidamente penalizados.

Los investigadores también destacan la necesidad de seguir investigando para hacer frente a estos sesgos y perfeccionar los métodos de detección actuales para garantizar un panorama digital más equitativo y seguro para todos los usuarios.

En otro estudio sobre texto generado por IA, los investigadores documentan la optimización de ejemplos en contexto basada en la sustitución (SICO), que permite a los grandes modelos lingüísticos (LLM) como ChatGPT eludir la detección de los detectores de texto generado por IA. En el estudio se utilizaron tres tareas para simular situaciones reales de uso de los LLM en las que es crucial detectar el texto generado por IA: redacciones académicas, preguntas y respuestas abiertas y reseñas comerciales.

También se probó SICO frente a seis detectores representativos -incluidos modelos basados en la formación, métodos estadísticos y API- que superaron sistemáticamente a otros métodos en todos los detectores y conjuntos de datos.

Los investigadores comprobaron que SICO era eficaz en todos los escenarios de uso probados. En muchos casos, el texto generado por SICO era indistinguible del texto escrito por humanos. Sin embargo, también pusieron de relieve el posible mal uso de esta tecnología. Dado que SICO puede ayudar a que el texto generado por IA evada la detección, los actores malintencionados también podrían utilizarla para crear información engañosa o falsa que parezca escrita por humanos.

Ambos estudios señalan el ritmo al que el desarrollo de la IA generativa supera al de los detectores de texto de IA, y el segundo hace hincapié en la necesidad de una tecnología de detección más sofisticada.

Los investigadores de un tercer estudio recopilaron estudios anteriores sobre la fiabilidad de los detectores de IA, seguidos de sus datos, y publicaron varias conclusiones sobre estas herramientas.

  • Aydin & Karaarslan (2022) revelaron que iThenticate, una popular herramienta de detección de plagio, encontró altas tasas de coincidencia con el texto parafraseado por ChatGPT.
  • Wang et al. (2023) descubrieron que es más difícil detectar código generado por IA que contenido en lenguaje natural. Además, algunas herramientas mostraron sesgos, inclinándose por identificar el texto como generado por IA o escrito por humanos.
  • Pegoraro et al. (2023) descubrieron que detectar texto generado por ChatGPT es muy difícil, y que la herramienta más eficaz lograba una tasa de éxito inferior al 50%.
  • Van Oijen (2023) reveló que la precisión global de las herramientas en la detección de texto generado por IA era sólo de alrededor del 28%, y que la mejor herramienta lograba sólo un 50% de precisión. Por el contrario, estas herramientas eran más eficaces (alrededor del 83% de precisión) en la detección de contenido escrito por humanos.
  • Anderson et al. (2023) observaron que la paráfrasis reducía notablemente la eficacia del detector de salida GPT-2.

Utilizando 14 herramientas de detección de texto generadas por IA, los investigadores crearon varias docenas de casos de prueba en diferentes categorías, entre ellas:

Texto escrito por humanos.
Texto traducido.
Texto generado por IA.
Texto generado por IA con ediciones humanas.
Texto generado por IA con parafraseo de IA.

La mayoría de las herramientas probadas mostraron un sesgo hacia la clasificación precisa del texto escrito por humanos, en comparación con el texto generado o modificado por IA. El estudio destacó también el riesgo de falsas acusaciones y casos no detectados. Los falsos positivos fueron mínimos en la mayoría de las herramientas, excepto en GPT Zero, que presentó una tasa elevada.

Los casos no detectados eran preocupantes, sobre todo en el caso de los textos generados por IA que habían sido editados por personas o parafraseados por máquinas. La mayoría de las herramientas tenían dificultades para detectar este tipo de contenidos, lo que supone una amenaza potencial para la integridad académica y la imparcialidad entre los estudiantes. Turnitin resultó ser la herramienta más precisa en todos los enfoques, seguida de Compilatio y GPT-2 Output Detector.

Los investigadores sugieren que abordar estas limitaciones será crucial para implantar eficazmente herramientas de detección de texto generadas por IA en entornos educativos, garantizando la detección precisa de conductas indebidas y minimizando al mismo tiempo las acusaciones falsas y los casos no detectados.

¿Deberíamos confiar en las herramientas de detección de IA basándose en los resultados de estos estudios? Aunque los detectores de IA han demostrado cierta precisión a la hora de detectar texto generado por IA, también han mostrado sesgos, problemas de usabilidad y vulnerabilidades ante las técnicas de elusión Se necesitan mejoras para corregir los sesgos, aumentar la robustez y garantizar una detección precisa en diferentes contextos. La investigación y el desarrollo continuados son cruciales para fomentar la confianza en los detectores de IA y crear un panorama digital más equitativo y seguro.

Investigadores de la Universidad de Kansas afirman haber desarrollado un algoritmo con una precisión del 99% en la detección de falsificaciones de ChatGPT

Desaire, Heather, Aleesa E. Chua, Madeline Isom, Romana Jarosova, y David Hua. «Distinguishing Academic Science Writing from Humans or ChatGPT with over 99% Accuracy Using Off-the-Shelf Machine Learning Tools». Cell Reports Physical Science 0, n.o 0 (7 de junio de 2023). https://doi.org/10.1016/j.xcrp.2023.101426.

Investigadores de la Universidad de Kansas afirman tener una precisión del 99% en la detección de falsificaciones de ChatGPT. Los investigadores afirman que su algoritmo puede detectar escritos científicos realizados por robots con una precisión sorprendente

Científicos de la Universidad de Kansas publicaron un artículo el miércoles en el que detallan un algoritmo que, según dicen, detecta la escritura académica de ChatGPT con una precisión de más del 99%.

A medida que el contenido del chatbot de IA comienza a inundar el mundo, una de las mayores preocupaciones es poder distinguir de manera confiable entre las palabras de los robots y las de los seres humanos reales. Se han realizado algunos intentos de construir detectores de ChatGPT, y decenas de empresas compiten por desarrollar tecnología para detectar la IA. Pero hasta ahora, ninguna de las opciones funciona bien, incluso una construida por OpenAI, la empresa que creó ChatGPT. Las herramientas existentes son tan ineficaces que son prácticamente inútiles.

El detector de ChatGPT descrito en el artículo solo está diseñado para funcionar en contextos específicos, pero su éxito reportado parece prometedor. En el proceso de construcción, los investigadores afirman haber identificado señales reveladoras de la escritura de IA.

El artículo, que fue revisado por pares y publicado en Cell Reports Physical Science, describe una técnica que detecta artículos de investigación académica escritos por IA. El estudio seleccionó un conjunto de 64 artículos científicos escritos por autores humanos en una variedad de disciplinas, desde biología hasta física. Alimentaron esos datos a ChatGPT y lo utilizaron para producir un conjunto de datos de 128 artículos de IA con un total de 1.276 párrafos generados por el chatbot. Los científicos utilizaron esos párrafos falsos para construir su algoritmo de detección de ChatGPT. Luego crearon un nuevo conjunto de datos para probar su algoritmo con 30 artículos reales y 60 artículos escritos por ChatGPT, lo que suma un total de 1.210 párrafos.

Los investigadores afirman que su algoritmo detectó artículos completos escritos por ChatGPT el 100% de las veces. A nivel de párrafo, fue menos preciso pero aún impresionante: el algoritmo identificó el 92% de los párrafos generados por IA.

Los investigadores esperan que otros utilicen su trabajo para adaptar el software de detección a sus propios nichos y propósitos. «Nos esforzamos mucho para crear un método accesible para que, con poca orientación, incluso los estudiantes de secundaria puedan construir un detector de IA para diferentes tipos de escritura», dijo Heather Desaire, autora del artículo y profesora de química en la Universidad de Kansas, en una entrevista con EurekAlert. «Existe la necesidad de abordar la escritura de IA, y las personas no necesitan tener un título en ciencias de la computación para contribuir a este campo».

El artículo menciona algunas señales reveladoras del trabajo de ChatGPT. Por ejemplo, los escritores humanos redactan párrafos más largos, utilizan un vocabulario más amplio, incluyen más signos de puntuación y tienden a calificar sus afirmaciones con palabras como «sin embargo», «pero» y «aunque». ChatGPT también es menos específico en cuanto a las citas, como figuras y menciones de otros científicos.

El modelo desarrollado por Desaire y sus colaboradores no funcionará de manera inmediata para los profesores que esperan penalizar a los estudiantes de secundaria que hacen trampa. El algoritmo fue creado para la escritura científica, específicamente el tipo de escritura académica que se encuentra en revistas. Esto es una lástima para los formadores y gestores que, en general, han pasado los últimos seis meses preocupados por el plagio facilitado por ChatGPT. Sin embargo, Desaire afirmó que teóricamente se puede utilizar la misma técnica para construir un modelo que detecte otros tipos de escritura.

Las cosas se complican cuando consideramos el hecho de que un escritor podría realizar fácilmente pequeñas modificaciones a un texto generado por el chatbot y hacerlo mucho más difícil de detectar. Aun así, los investigadores describieron este trabajo como una «prueba de concepto» y afirman que podrían desarrollar una herramienta más robusta y quizás más precisa con un conjunto de datos más amplio.

Aunque estos resultados son prometedores, las empresas de tecnología y los defensores de la IA señalan que herramientas como ChatGPT están en sus etapas iniciales. Es imposible decir si los métodos de detección como este serán efectivos si la IA continúa desarrollándose al ritmo acelerado que hemos presenciado en los últimos años. Cuanto más se acerquen los modelos de lenguaje grandes a replicar los murmullos de la escritura humana basada en carne, más difícil será identificar las huellas del lenguaje de los robots.

Según Turnitin, el 3,5% de las consultas que pasaron por el detector de IA contenían más del 80% de texto escrito con IA

Kuykendall, By Kristal, y 05/30/23. «Turnitin: Of 38M Submissions Since April 4, 3.5% Had At Least 80% AI-Written Text -». Campus Technology. Accedido 2 de junio de 2023. https://campustechnology.com/articles/2023/05/turnitin-says-its-ai-detector-analyzed-38m-submissions-in-six-weeks.aspx.

Según Turnitin, el 3,5% de las consultas que pasaron por el detector de IA contenían más del 80% de texto escrito con IA, y algo menos de una décima parte de los envíos contenían al menos un 20% de texto escrito con IA.

Turnitin informó de que, de 38 millones de consultas realizadas desde el 4 de abril, aproximadamente el 3,5% de ellos contenían al menos un 80% de texto escrito por IA. Esto sugiere que hay una notable presencia de texto generado por IA en los envíos que Turnitin ha procesado.

De manera que en las primeras seis semanas de uso por parte de los educadores de la nueva función de detección de escritura por IA de Turnitin, ha llevado a la plataforma a ajustar el detector y a explicar mejor el significado y los índices de precisión de las puntuaciones de detección.

Las actualizaciones de la función de detección de IA inclyen:

  • Se ha añadido un asterisco a las puntuaciones inferiores al 20%: Ahora aparecerá un asterisco junto al indicador «puntuación» -o el porcentaje de un envío que se considera texto escrito con IA- cuando la puntuación sea inferior al 20%, ya que el análisis de los envíos hasta ahora muestra que los falsos positivos son mayores cuando el detector encuentra que menos del 20% de un documento está escrito con IA. El asterisco indica que la puntuación es menos fiable, según la entrada del blog.
  • Aumento del número mínimo de palabras: El número mínimo de palabras necesario para que el detector de IA funcione se ha aumentado de 150 a 300, porque el detector es más preciso cuanto más largo es un envío, dijo Chechitelli. «Los resultados demuestran que nuestra precisión aumenta con un poco más de texto, y nuestro objetivo es centrarnos en los escritos largos. Es posible que con el tiempo modifiquemos este requisito de palabras mínimas basándonos en la evaluación continua de nuestro modelo.»
  • Cambios en el análisis del detector de frases iniciales y finales: «También observamos una mayor incidencia de falsos positivos en las primeras o últimas frases de un documento», dijo Chechitelli. «Muchas veces, estas frases son la introducción o la conclusión en un documento. Como resultado, hemos cambiado la forma de agregar estas frases específicas para la detección con el fin de reducir los falsos positivos.»

Es importante señalar que la capacidad de Turnitin para detectar texto generado por IA se basa en sus algoritmos y bases de datos que comparan el texto enviado con las fuentes existentes para identificar posibles casos de plagio. Aunque Turnitin puede detectar casos en los que el texto generado por IA se ha copiado directamente de fuentes existentes, puede tener dificultades para identificar el plagio cuando el texto generado por IA es original y no procede de publicaciones existentes.

A medida que siga evolucionando el uso de la IA en la generación de texto, es posible que las herramientas de detección como Turnitin tengan que adaptarse y desarrollar nuevas técnicas para identificar y abordar eficazmente el plagio generado por IA. Las instituciones y organizaciones educativas también pueden necesitar establecer políticas y directrices específicas para abordar el uso de contenidos generados por IA y el plagio en entornos académicos.

Vale la pena mencionar que las cifras proporcionadas por Turnitin ponen de relieve la prevalencia del texto generado por IA, pero sería necesario realizar más análisis e investigaciones para comprender plenamente el impacto y las implicaciones del contenido generado por IA en el contexto de la integridad académica y la detección del plagio.

Comparación de los 16 mejores detectores de contenidos AI y ChatGPT

Demers, T. (2023, abril 25). 16 of the best AI and ChatGPT content detectors compared. Search Engine Land. https://searchengineland.com/ai-chatgpt-content-detectors-395957

Como cada día aparecen nuevas alternativas a ChatGPT, los detectores de contenido de IA también están ganando popularidad. En este artículo, se comparan16 de estos detectores y se muestra cómo puntúan algunos párrafos de un escrito original no publicado frente a algunos párrafos sobre el mismo tema de ChatGPT.

Herramientas de detección:

La IA generativa y los contenidos ChatGPT plantean varios problemas:

  • La información generada por IA puede ser incorrecta, peligrosa, obsoleta o engañosa.
  • Los resultados de la escritura de la IA pueden ser deficientes.
  • Aunque no se penaliza explícitamente el contenido generado por IA, es posible que Google no siempre confíe en él y lo considere igual que el contenido creado por humanos.
  • El contenido de IA puede «engañar» a los editores o a las empresas que creen que están pagando por contenido creado por humanos.
  • El contenido de IA puede aprovechar el trabajo creativo de los humanos y reutilizarlo sin atribución.

Es importante señalar que los detectores de IA actuales no resuelven todos estos problemas. En su mayoría, estas herramientas no comprueban los contenidos de la IA, no mejoran ni auditan la calidad de los contenidos, ni proporcionan citas de la información extraída de otras fuentes.

Dicho esto, las áreas en las que los detectores de IA pueden ayudar incluyen:

  • Plagio: Muchas de estas herramientas llevan incorporada la detección de plagio, por lo que se puede comprobar si el contenido de la IA se ha extraído en gran medida de otra fuente.
  • Prevención de sanciones: Si te preocupa que el contenido de IA se devalúe de algún modo en los resultados de búsqueda, estas herramientas pueden ayudarte a hacerte una idea de lo fácilmente detectable que es el contenido de IA. (Por supuesto, Google tendrá sin duda herramientas y comprobaciones diferentes).
  • Auditar el uso de la IA: Si tienes una política específica o una forma de compensar a los redactores por el contenido original frente al generado por IA, estas herramientas pueden darte una idea aproximada de si un redactor utiliza IA para generar contenido.
  • Tenga en cuenta que también pueden arrojar falsos negativos y positivos).
  • Comprender los resultados de búsqueda: Algunas de estas herramientas ofrecen extensiones de Chrome, que pueden ayudarle a comprender si los competidores y otros sitios web utilizan o no contenidos generados por IA.

Cómo funciona el software de detección de IA

Cada herramienta es diferente y tiene su propio enfoque del problema. Pero, en general, las herramientas de detección de ChatGPT califican los contenidos en función de la previsibilidad de las frases elegidas.

En otras palabras, la probabilidad de que el contenido sea calificado como IA frente a humano tiene mucho que ver con si el software de detección considera que un fragmento de texto sigue el patrón probable que seguiría la IA para generar contenido.

Los dos conceptos básicos en torno a este proceso se denominan:

Ráfaga: Longitud y ritmo predecibles de la estructura de la frase.

Perplejidad: Aleatoriedad de las palabras elegidas en una frase o conjunto de frases.

Por ejemplo, en un ensayo sobre la fundación de Estados Unidos, es muy poco probable que la IA generativa incluya una anécdota aleatoria, escrita de forma irregular, sobre la primera vez que vio un pingüino, por lo que una herramienta de detección probablemente la vería como una escritura humana.

Del mismo modo que aparecieron detectores de ChatGPT para detectar la escritura de IA generativa, ya se están desarrollando herramientas para sortear los detectores. Herramientas como Undetectable o Quillbot reescribirán tu contenido, a veces haciéndolo más difícil de detectar para ciertas herramientas de detección de IA.

Comparación de los mejores detectores de escritura por IA

Si todavía estás buscando un detector de contenido IA/ChatGPT, vamos a repasar cada uno de ellos y cómo «puntuaron» en la evaluación de la copia generada por humanos frente a la copia IA frente a la copia IA que utilizó este aviso para intentar «superar la detección».

En la tabla que aparece a continuación, puedes ver cómo puntuó cada herramienta la copia escrita por un humano y el texto tomado directamente de ChatGPT sin modificar nada, y esa misma copia modificada con la pregunta «perplejidad y explosividad»:

Principales conclusiones de las pruebas realizadas con 16 verificadores de contenido AI y ChatGPT

Una vez más, es esencial advertir aquí de mis principales conclusiones, ya que tres breves muestras de escritura son muestras muy pequeñas para extraer conclusiones firmes sobre las herramientas individuales.

Dicho esto, se han encontrado algunos patrones interesantes relacionados con los detectores de escritura de IA en general:

  • Calibración: La mayoría de las herramientas encontraron muy probable o muy improbable que las tres muestras de escritura fueran humanas. Es probable que las distintas herramientas sean «más duras» o «más blandas» a la hora de calificar el contenido humano frente al de la IA, por lo que entender cómo está calibrada una herramienta puede ayudar a determinar su utilidad.
  • Características más raras: Algunas de las características menos comunes entre las herramientas son las cargas masivas, la detección de plagio, tener una extensión de Chrome y resaltar secciones específicas con probabilidad de ser IA frente a humano.
  • Gratuito o de pago: Todas las herramientas presentadas aquí excepto Originality.AI tenían al menos versiones gratuitas. Pero las herramientas con los resultados más precisos y la mayoría de las «características raras» tendían a ser las herramientas con una versión de pago.

El ritmo de la innovación en la generación, edición y detección de contenidos de IA puede hacer que tu herramienta favorita se quede obsoleta rápidamente.