Archivo de la etiqueta: Plagio

ChatGPT: La inteligencia artificial y la generación de textos académicos: avances y desafíos

ChatGPT: La inteligencia artificial y la generación de textos académicos: avances y desafíos. Por Julio Alonso Arévalo

Consorcio de Bibliotecas Universitarias de El Salvador el 30 de mayo de 2023

VER VIDEO

La inteligencia artificial (IA) ha experimentado avances significativos en la generación de texto académico en los últimos años. Estos avances se deben principalmente al desarrollo de modelos de lenguaje basados en redes neuronales, como el modelo GPT (Transformador Generativo Pre-entrenado), que ha demostrado ser capaz de generar texto coherente y de calidad en una variedad de dominios. Una de las principales ventajas de utilizar IA para generar texto académico es su capacidad para procesar grandes cantidades de información y producir resultados rápidamente. Sin embargo, también existen desafíos asociados con la generación de texto académico mediante IA. Uno de los desafíos más importantes es garantizar la precisión y la fiabilidad de la información generada. Aunque los modelos de IA pueden generar texto coherente, no siempre pueden verificar la veracidad de los hechos o la calidad de las fuentes utilizadas. Esto puede ser problemático en el contexto académico, donde la precisión y la evidencia son fundamentales.

Otro desafío es la necesidad de evitar el plagio y respetar los derechos de autor. Al generar texto académico automáticamente, existe el riesgo de que se reproduzcan ideas o información sin la debida atribución. Es importante implementar salvaguardas para garantizar que el contenido generado sea original y cumpla con los estándares éticos y legales de la investigación académica.

Según Turnitin, el 3,5% de las consultas que pasaron por el detector de IA contenían más del 80% de texto escrito con IA

Kuykendall, By Kristal, y 05/30/23. «Turnitin: Of 38M Submissions Since April 4, 3.5% Had At Least 80% AI-Written Text -». Campus Technology. Accedido 2 de junio de 2023. https://campustechnology.com/articles/2023/05/turnitin-says-its-ai-detector-analyzed-38m-submissions-in-six-weeks.aspx.

Según Turnitin, el 3,5% de las consultas que pasaron por el detector de IA contenían más del 80% de texto escrito con IA, y algo menos de una décima parte de los envíos contenían al menos un 20% de texto escrito con IA.

Turnitin informó de que, de 38 millones de consultas realizadas desde el 4 de abril, aproximadamente el 3,5% de ellos contenían al menos un 80% de texto escrito por IA. Esto sugiere que hay una notable presencia de texto generado por IA en los envíos que Turnitin ha procesado.

De manera que en las primeras seis semanas de uso por parte de los educadores de la nueva función de detección de escritura por IA de Turnitin, ha llevado a la plataforma a ajustar el detector y a explicar mejor el significado y los índices de precisión de las puntuaciones de detección.

Las actualizaciones de la función de detección de IA inclyen:

  • Se ha añadido un asterisco a las puntuaciones inferiores al 20%: Ahora aparecerá un asterisco junto al indicador «puntuación» -o el porcentaje de un envío que se considera texto escrito con IA- cuando la puntuación sea inferior al 20%, ya que el análisis de los envíos hasta ahora muestra que los falsos positivos son mayores cuando el detector encuentra que menos del 20% de un documento está escrito con IA. El asterisco indica que la puntuación es menos fiable, según la entrada del blog.
  • Aumento del número mínimo de palabras: El número mínimo de palabras necesario para que el detector de IA funcione se ha aumentado de 150 a 300, porque el detector es más preciso cuanto más largo es un envío, dijo Chechitelli. «Los resultados demuestran que nuestra precisión aumenta con un poco más de texto, y nuestro objetivo es centrarnos en los escritos largos. Es posible que con el tiempo modifiquemos este requisito de palabras mínimas basándonos en la evaluación continua de nuestro modelo.»
  • Cambios en el análisis del detector de frases iniciales y finales: «También observamos una mayor incidencia de falsos positivos en las primeras o últimas frases de un documento», dijo Chechitelli. «Muchas veces, estas frases son la introducción o la conclusión en un documento. Como resultado, hemos cambiado la forma de agregar estas frases específicas para la detección con el fin de reducir los falsos positivos.»

Es importante señalar que la capacidad de Turnitin para detectar texto generado por IA se basa en sus algoritmos y bases de datos que comparan el texto enviado con las fuentes existentes para identificar posibles casos de plagio. Aunque Turnitin puede detectar casos en los que el texto generado por IA se ha copiado directamente de fuentes existentes, puede tener dificultades para identificar el plagio cuando el texto generado por IA es original y no procede de publicaciones existentes.

A medida que siga evolucionando el uso de la IA en la generación de texto, es posible que las herramientas de detección como Turnitin tengan que adaptarse y desarrollar nuevas técnicas para identificar y abordar eficazmente el plagio generado por IA. Las instituciones y organizaciones educativas también pueden necesitar establecer políticas y directrices específicas para abordar el uso de contenidos generados por IA y el plagio en entornos académicos.

Vale la pena mencionar que las cifras proporcionadas por Turnitin ponen de relieve la prevalencia del texto generado por IA, pero sería necesario realizar más análisis e investigaciones para comprender plenamente el impacto y las implicaciones del contenido generado por IA en el contexto de la integridad académica y la detección del plagio.

Herramientas gratuitas para detectar tesis, trabajos de investigación, tareas, documentación y blogs generados por modelos de IA. ChatGPT, GPT-4, Bard y Claude

«Top 10 Tools for Detecting ChatGPT, GPT-4, Bard, and Claude». KDnuggets (blog). Accedido 30 de mayo de 2023. https://www.kdnuggets.com/top-10-tools-for-detecting-chatgpt-gpt-4-bard-and-claude.html.

Vivimos en una época de auge de la inteligencia artificial (IA), en la que cada semana aparecen nuevos modelos lingüísticos de gran tamaño (LLM) que pueden escribir como los humanos. Estos modelos pueden generar contenidos muy creativos y, por desgracia, algunos estudiantes y profesionales los utilizan indebidamente para plagiar.

Como resultado, las herramientas de detección de IA se han convertido en algo esencial en todas las aulas, lugares de trabajo e institutos de investigación. Todas las herramientas mencionadas en este blog son gratuitas, y algunas de ellas incluso vienen con extensiones de Chrome para que puedas detectar contenidos sobre la marcha.

  1. GPTZero

GPTZero se ha mejorado significativamente. Ahora es muy preciso, fácil de usar e incluye una extensión para Chrome. Puede utilizarlo para detectar una amplia gama de texto generado por IA, incluido el texto de los últimos modelos como Bard (PalM 2), ChatGPT, GPT-4 y otros modelos de código abierto. Además, es rápido y resalta el texto generado para facilitar su identificación.

  1. OpenAI AI Text Classifier

AI Text Classifier de OpenAI es muy preciso, pero no proporciona información adicional sobre el contenido. Funciona para New Bard, ChatGPT, GPT-4 y otros modelos basados en LLaMA.

  1. CopyLeaks

CopyLeaks. Es un verificador de plagio rápido y preciso que viene con una simple extensión de Chrome. Incluso puedes pasar el ratón sobre el texto resaltado para comprobar la popularidad de la IA. Puede detectar Bard, ChatGPT, GPT-4 y otros grandes modelos lingüísticos (LLM).

  1. Typeset

Academic AI Detector es un poco diferente de las otras herramientas mencionadas. Es muy preciso, pero se diseñó específicamente para detectar contenido académico en PDF. No hay opción de copiar y pegar por el momento, pero el equipo técnico está trabajando para añadir esa característica. Puedes cargar cualquier tipo de trabajo académico como PDF y Typeset generará resultados. Typeset detecta contenido generado por Bard, ChatGPT y HuggingChat, y lo ha detectado todo con precisión.

  1. Moderación de Hive

La detección de contenidos generados por AI Generative Content Detection a veces identifica erróneamente contenidos generados por humanos como IA. Para garantizar resultados fiables, es aconsejable disponer de una herramienta de respaldo cuando se utilice como recurso principal. Además, ofrece la capacidad de detectar imágenes generadas por IA de plataformas como DALL-E, Midjourney y Stable Diffusion.

  1. Content at Scale

AI Content Detector de Content at Scale es fácil de usar y produce informes bastante precisos sobre predictibilidad, probabilidad y patrón. Funciona con todo tipo de modelos lingüísticos de gran tamaño (LLM) más recientes y destaca el contenido en función de la probabilidad variable de que la IA genere trabajo…

  1. Hello Simple AI

 ChatGPT Detector de Hello Simple AI es una herramienta gratuita y de código abierto que puede utilizarse para detectar texto generado por ChatGPT. Está alojada en Hugging Face Spaces y proporciona resultados rápidos y bastante precisos. El detector no es tan preciso como OpenAI AI Text Classifier, pero proporciona dos métricas (GLTR y probabilidad PPL) que pueden ayudar a determinar si el contenido está generado por IA o no.

  1. OpenAI Detector

OpenAI Detector es una herramienta gratuita y de código abierto que puede utilizarse para detectar texto generado por el modelo de lenguaje GPT de OpenAI. Está alojado en Hugging Face Spaces y proporciona resultados rápidos. Sin embargo, el detector puede ser muy impreciso, especialmente cuando se trata de detectar versiones más recientes de los modelos de OpenAI y otros modelos de lenguaje de gran tamaño de código abierto.

  1. AI Detector 

AI Detector  es una herramienta bastante precisa que puede utilizarse para detectar texto generado por ChatGPT, Bard y otras versiones antiguas de grandes modelos lingüísticos (LLM). Sin embargo, no es capaz de detectar versiones más recientes de LLM. Esto se debe a que funciona analizando la sintaxis y la semántica del texto, y los LLM más recientes son mejores generando texto que no se distingue del texto escrito por humanos.

  1. Writer.com

El Detector de Contenido AI de Writer se presenta como la opción menos precisa con una limitación de 1500 caracteres. Sirve como solución alternativa cuando otras herramientas no están disponibles o son ineficaces.

Publicaciones falsas en ciencias biomédicas: el método Red-Flagging indica una producción masiva

Sabel, Bernhard A., Emely Knaack, Gerd Gigerenzer, y Mirela Bilc. «Fake Publications in Biomedical Science: Red-Flagging Method Indicates Mass Production». medRxiv, 8 de mayo de 2023. https://doi.org/10.1101/2023.05.06.23289563.

La integridad de las publicaciones académicas se ve cada vez más socavada por las publicaciones científicas falsas producidas masivamente por «servicios de edición» comerciales (las llamadas «fábricas de artículos»). Estos servicios utilizan técnicas de producción automatizadas y asistidas por IA a gran escala y venden publicaciones falsas a estudiantes, científicos y médicos presionados para avanzar en sus carreras. Dado que se desconoce el alcance de las publicaciones falsas en biomedicina, hemos desarrollado un método sencillo para identificarlas y estimar su número.

Para identificar indicadores capaces de señalizar publicaciones falsas (RFP ed-flagged fake publications), enviamos cuestionarios a los autores. A partir de las respuestas de los autores, se identificaron tres indicadores: «correo electrónico privado del autor», «coautor internacional» y «afiliación hospitalaria». Estos indicadores se utilizaron para analizar 15.120 publicaciones incluidas en PubMed® con respecto a la fecha, la revista, el factor de impacto y el país del autor, y se validaron en una muestra de 400 falsificaciones conocidas y 400 presuntas no falsificaciones emparejadas utilizando reglas de clasificación (recuento) para marcar en rojo las posibles falsificaciones. Para una submuestra de 80 artículos se utilizó un indicador adicional relacionado con el porcentaje de citas RFP.

Resultados Las reglas de clasificación que utilizaron dos (tres) indicadores tuvieron sensibilidades del 86% (90%) y tasas de falsas alarmas del 44% (37%). De 2010 a 2020 la tasa de RFP aumentó del 16% al 28%. Teniendo en cuenta los 1,3 millones de publicaciones biomédicas incluidas en Scimago en 2020, estimamos el alcance de >300.000 RFP anuales. Los países con la mayor proporción de RFP son Rusia, Turquía, China, Egipto e India (39%-48%), siendo China, en términos absolutos, el mayor contribuyente de todas las RFP (55%).

Conclusiones Las publicaciones potencialmente falsas pueden señalarse mediante reglas de clasificación validadas y fáciles de usar para someterlas a un examen posterior. Los índices de RFP están aumentando, lo que sugiere que los índices reales de falsificación son más elevados que los registrados anteriormente. La magnitud y proliferación de las publicaciones falsas en biomedicina pueden dañar la confianza en la ciencia, poner en peligro la salud pública y repercutir en el gasto económico y la seguridad. Unos métodos de detección de falsificaciones fáciles de aplicar, como los que aquí se proponen, o unos métodos automatizados más complejos pueden ayudar a evitar más daños al registro científico permanente y permitir la retractación de publicaciones falsas a escala.

Comparación de los 16 mejores detectores de contenidos AI y ChatGPT

Demers, T. (2023, abril 25). 16 of the best AI and ChatGPT content detectors compared. Search Engine Land. https://searchengineland.com/ai-chatgpt-content-detectors-395957

Como cada día aparecen nuevas alternativas a ChatGPT, los detectores de contenido de IA también están ganando popularidad. En este artículo, se comparan16 de estos detectores y se muestra cómo puntúan algunos párrafos de un escrito original no publicado frente a algunos párrafos sobre el mismo tema de ChatGPT.

Herramientas de detección:

La IA generativa y los contenidos ChatGPT plantean varios problemas:

  • La información generada por IA puede ser incorrecta, peligrosa, obsoleta o engañosa.
  • Los resultados de la escritura de la IA pueden ser deficientes.
  • Aunque no se penaliza explícitamente el contenido generado por IA, es posible que Google no siempre confíe en él y lo considere igual que el contenido creado por humanos.
  • El contenido de IA puede «engañar» a los editores o a las empresas que creen que están pagando por contenido creado por humanos.
  • El contenido de IA puede aprovechar el trabajo creativo de los humanos y reutilizarlo sin atribución.

Es importante señalar que los detectores de IA actuales no resuelven todos estos problemas. En su mayoría, estas herramientas no comprueban los contenidos de la IA, no mejoran ni auditan la calidad de los contenidos, ni proporcionan citas de la información extraída de otras fuentes.

Dicho esto, las áreas en las que los detectores de IA pueden ayudar incluyen:

  • Plagio: Muchas de estas herramientas llevan incorporada la detección de plagio, por lo que se puede comprobar si el contenido de la IA se ha extraído en gran medida de otra fuente.
  • Prevención de sanciones: Si te preocupa que el contenido de IA se devalúe de algún modo en los resultados de búsqueda, estas herramientas pueden ayudarte a hacerte una idea de lo fácilmente detectable que es el contenido de IA. (Por supuesto, Google tendrá sin duda herramientas y comprobaciones diferentes).
  • Auditar el uso de la IA: Si tienes una política específica o una forma de compensar a los redactores por el contenido original frente al generado por IA, estas herramientas pueden darte una idea aproximada de si un redactor utiliza IA para generar contenido.
  • Tenga en cuenta que también pueden arrojar falsos negativos y positivos).
  • Comprender los resultados de búsqueda: Algunas de estas herramientas ofrecen extensiones de Chrome, que pueden ayudarle a comprender si los competidores y otros sitios web utilizan o no contenidos generados por IA.

Cómo funciona el software de detección de IA

Cada herramienta es diferente y tiene su propio enfoque del problema. Pero, en general, las herramientas de detección de ChatGPT califican los contenidos en función de la previsibilidad de las frases elegidas.

En otras palabras, la probabilidad de que el contenido sea calificado como IA frente a humano tiene mucho que ver con si el software de detección considera que un fragmento de texto sigue el patrón probable que seguiría la IA para generar contenido.

Los dos conceptos básicos en torno a este proceso se denominan:

Ráfaga: Longitud y ritmo predecibles de la estructura de la frase.

Perplejidad: Aleatoriedad de las palabras elegidas en una frase o conjunto de frases.

Por ejemplo, en un ensayo sobre la fundación de Estados Unidos, es muy poco probable que la IA generativa incluya una anécdota aleatoria, escrita de forma irregular, sobre la primera vez que vio un pingüino, por lo que una herramienta de detección probablemente la vería como una escritura humana.

Del mismo modo que aparecieron detectores de ChatGPT para detectar la escritura de IA generativa, ya se están desarrollando herramientas para sortear los detectores. Herramientas como Undetectable o Quillbot reescribirán tu contenido, a veces haciéndolo más difícil de detectar para ciertas herramientas de detección de IA.

Comparación de los mejores detectores de escritura por IA

Si todavía estás buscando un detector de contenido IA/ChatGPT, vamos a repasar cada uno de ellos y cómo «puntuaron» en la evaluación de la copia generada por humanos frente a la copia IA frente a la copia IA que utilizó este aviso para intentar «superar la detección».

En la tabla que aparece a continuación, puedes ver cómo puntuó cada herramienta la copia escrita por un humano y el texto tomado directamente de ChatGPT sin modificar nada, y esa misma copia modificada con la pregunta «perplejidad y explosividad»:

Principales conclusiones de las pruebas realizadas con 16 verificadores de contenido AI y ChatGPT

Una vez más, es esencial advertir aquí de mis principales conclusiones, ya que tres breves muestras de escritura son muestras muy pequeñas para extraer conclusiones firmes sobre las herramientas individuales.

Dicho esto, se han encontrado algunos patrones interesantes relacionados con los detectores de escritura de IA en general:

  • Calibración: La mayoría de las herramientas encontraron muy probable o muy improbable que las tres muestras de escritura fueran humanas. Es probable que las distintas herramientas sean «más duras» o «más blandas» a la hora de calificar el contenido humano frente al de la IA, por lo que entender cómo está calibrada una herramienta puede ayudar a determinar su utilidad.
  • Características más raras: Algunas de las características menos comunes entre las herramientas son las cargas masivas, la detección de plagio, tener una extensión de Chrome y resaltar secciones específicas con probabilidad de ser IA frente a humano.
  • Gratuito o de pago: Todas las herramientas presentadas aquí excepto Originality.AI tenían al menos versiones gratuitas. Pero las herramientas con los resultados más precisos y la mayoría de las «características raras» tendían a ser las herramientas con una versión de pago.

El ritmo de la innovación en la generación, edición y detección de contenidos de IA puede hacer que tu herramienta favorita se quede obsoleta rápidamente.

Cambridge University Press publica los principios de política de ética en la investigación de la IA, que prohíbe tratarla como «autora» de artículos y libros académicos.

Cambridge principles for generative AI in research publishing, Cambridge University Press, 2023

Las normas se recogen en la primera política ética de la IA de Cambridge University Press y se aplican a artículos de investigación, libros y otros trabajos académicos.

Incluyen la prohibición de que la IA sea tratada como «autora» de los artículos académicos y libros que publicamos. Esta medida aporta claridad a los académicos en medio de la preocupación por el uso erróneo o engañoso de potentes modelos lingüísticos de gran tamaño como ChatGPT en la investigación, junto con el entusiasmo por su potencial.

Mandy Hill, Directora General de Publicaciones Académicas de Cambridge, ha declarado: «La IA generativa puede abrir nuevas vías de investigación y experimentación. Los investigadores nos han pedido que les orientemos sobre su uso».

Creemos que los autores académicos, los revisores y los editores deben tener libertad para utilizar las tecnologías emergentes como consideren oportuno dentro de unas directrices adecuadas, al igual que hacen con otras herramientas de investigación».

«Al igual que nuestra comunidad académica, abordamos esta nueva tecnología con un espíritu de compromiso crítico. Al dar prioridad a la transparencia, la responsabilidad, la precisión y la originalidad, vemos tanto continuidad como cambio en el uso de la IA para la investigación.

Los principios de Cambridge para la IA generativa en la publicación de investigaciones incluyen que:

  • La IA debe declararse y explicarse claramente en publicaciones como los trabajos de investigación, al igual que hacen los académicos con otros programas informáticos, herramientas y metodologías.
  • La IA no cumple los requisitos de Cambridge sobre autoría, dada la necesidad de rendir cuentas. Las herramientas de IA y LLM no pueden figurar como autor en ningún trabajo académico publicado por Cambridge.
  • Cualquier uso de la IA no debe infringir la política de plagio de Cambridge. Los trabajos académicos deben ser propios del autor y no presentar ideas, datos, palabras u otro material de otros sin una citación adecuada y una referenciación transparente.
  • Los autores son responsables de la exactitud, integridad y originalidad de sus trabajos de investigación, incluido cualquier uso de la IA.

Un artículo sobre ChatGPT escrito por ChatGPT

Nicole Meilak. «We Used ChatGPT to Write an Article about ChatGPT». MaltaToday.com.mt, 2023. Accedido 2 de marzo de 2023. http://www.maltatoday.com.mt/news/national/120906/we_used_chatgpt_to_write_an_article_about_chatgpt.

Se utilizo ChatGPT para escribir un artículo sobre ChatGPT. MaltaToday se puso en contacto con varios expertos para que comentaran ChatGPT desde distintos ángulos. A continuación, pedimos a ChatGPT que escribiera la noticia por nosotros. He aquí el resultado

El texto que figura a continuación fue redactado por ChatGPT tras recibir los comentarios de varios expertos locales en IA. Los únicos cambios introducidos en el texto son correcciones en el título de un experto y cambios para reflejar un estilo de escritura británico-inglés. Lee nuestro artículo original sobre ChatGPT aquí.

ChatGPT de OpenAI, una potente herramienta de IA capaz de analizar textos y generar respuestas personalizadas, tiene el potencial de cambiar nuestra forma de trabajar, estudiar y vivir. Sin embargo, su integración en el sistema educativo ha suscitado un debate sobre las posibles consecuencias del uso de la escritura asistida por IA en las evaluaciones.

Según Alex Grech, consultor y académico, «A primera vista, ChatGPT de OpenAI cambia las reglas del juego de la educación. Los vaticinadores vociferan que representa el fin de la redacción y las evaluaciones, y que la escritura asistida por IA marcará el comienzo de una nueva era de trampas y plagios que no podrán ser detectados por programas como Turnitin. La tentación es prohibir el acceso a ChatGPT a través de redes escolares propias o incluso volver a los exámenes de lápiz y papel».

A pesar de esta preocupación, Grech también señala que la capacidad de la tecnología de utilizar consultas y comandos en lenguaje normal para producir resultados aparentemente personalizados la convierte en una herramienta valiosa para la educación. Sugiere que ChatGPT puede utilizarse para mejorar la alfabetización digital y las habilidades de pensamiento crítico de los estudiantes. «Utilizaré ChatGPT con mis alumnos de primer curso de comunicación en un proyecto de trabajo. Lo incorporaré como otra herramienta innovadora para ayudar a los jóvenes a convertirse en analfabetos digitales y pensadores críticos, en sus itinerarios de aprendizaje permanente», afirma.

Alexiei Dingli, catedrático de Inteligencia Artificial, también destaca el potencial de ChatGPT para cambiar nuestra forma de trabajar, estudiar y vivir. ChatGPT es una potente herramienta de IA que puede cambiar nuestra forma de trabajar, estudiar y vivir. Su capacidad para analizar textos, resumir artículos, extraer puntos clave y reescribirlos de forma concisa la convierte en una herramienta inestimable para cualquiera que desee comprender información compleja de forma rápida y sencilla. Esto lo hace especialmente útil para empresas y particulares de una amplia gama de sectores».

Dingli también señala que las respuestas de tipo humano de la herramienta, su rentabilidad (gratuita hasta ahora) y su facilidad de uso también la hacen accesible a cualquiera, lo que ha propiciado un rápido ritmo de adopción, con más de un millón de usuarios probando la herramienta en la primera semana de su lanzamiento y su rápido aumento desde entonces.

«El impacto potencial de ChatGPT en el sistema educativo pone de manifiesto la necesidad de reevaluar los métodos de enseñanza tradicionales y la integración de las nuevas tecnologías», concluye Grech. «Puede que haga falta un desarrollo tecnológico disruptivo como el chatbot para obligar al sistema educativo a adoptar enfoques más profundamente humanos de la enseñanza y el aprendizaje».

La integración de ChatGPT en el sistema educativo también ha suscitado un debate entre lingüistas y expertos en idiomas. Albert Gatt, profesor de Lingüística de la Universidad de Malta, comenta que «ChatGPT es una herramienta poderosa que tiene la capacidad de procesar grandes cantidades de datos lingüísticos y generar textos coherentes y fluidos. Sin embargo, esto no significa que tenga un conocimiento profundo del significado y el contexto del texto que genera. El resultado del modelo puede ser impresionante, pero existe el peligro de confiar demasiado en él, sobre todo en el ámbito de la educación, donde la comprensión y el pensamiento crítico son fundamentales».

Patrick Camilleri, profesor especializado en Inteligencia Artificial en la educación, comparte esta opinión: «ChatGPT puede generar textos impresionantes, pero no puede sustituir a la comprensión y el pensamiento crítico humanos. El uso de esta herramienta en el aula puede provocar una disminución de la capacidad de los estudiantes para analizar y evaluar críticamente la información. La educación debe centrarse en enseñar a los estudiantes a pensar por sí mismos y no confiar en la IA para que piense por ellos».

Es importante señalar que ChatGPT, aunque potente, no sustituye a la comprensión y el pensamiento crítico humanos. Su uso en el sistema educativo debe evaluarse cuidadosamente para garantizar que no se utiliza para sustituir estas importantes habilidades.

La integración de ChatGPT en el sistema educativo ha suscitado un debate sobre sus posibles consecuencias: algunos expertos destacan la posibilidad de que aumenten las trampas y el plagio, mientras que otros lo consideran una herramienta valiosa para mejorar la alfabetización digital y las habilidades de pensamiento crítico de los estudiantes. Sin embargo, como señalan Gatt y Camilleri, es importante ser consciente de las capacidades y limitaciones de la herramienta y utilizarla con precaución en el aula.

Los creadores de ChatGPT han lanzado una herramienta para detectar texto escrito con IA

AI Text Classifier

Con las nuevas tecnologías basadas en Inteligencia artificial que están llegando al mercado, es esencial detectar si un documento es original o escrito por un chatbot de IA. AI Classifier es una herramienta de IA que distingue si una persona ha generado un texto a través de una aplicación o lo ha escrito manualmente.

AI Text Classifier es una nueva herramienta de la empresa Open AI, los mismos creadores de ChatGPT, que detecta si un pasaje de texto ha sido escrito o no con ChatGPT y herramientas de escritura de IA similares. Para utilizar AI Text Classifier es necesario registrarse para obtener una cuenta gratuita en Open AI. Una vez que tengas una cuenta, podrás utilizar AI Text Classifier. Para utilizar AI Text Classifier sólo tiene que pegar un bloque del documento a analizar (al menos 1.000 caracteres, aproximadamente 175 palabras) en el campo de texto y hacer clic en el botón de envío. AI Text Classifier clasificará el texto como muy improbable, probable, poco probable, posiblemente o probablemente escrito con una herramienta de Inteligencia artificial

Para detectar si los contenidos son escritos por un humano o un chatbot, la herramienta trabaja a partir de:

Análisis aritmético. En este enfoque, se calculan varias cifras, como la regularidad de los términos, la extensión de las frases y la construcción lingüística, a partir de una enorme cantidad de texto generado por la IA y de contenido escrito por humanos. A continuación, el clasificador de IA establece una equivalencia entre las cifras del contenido introducido y los datos de la escritura humana y la generada por la IA en el cuerpo del texto para realizar un cálculo. La herramienta se entrena de tal modo que detecta cómo un usuario ha expuesto el contenido y lo ha hecho suyo, para ello necesita actualizarse regularmente para determinar realmente si un texto está generado por IA.

Aprendizaje profundo. El sistema aprende a detectar formas en el contenido y a hacer predicciones sobre su origen basándose en estas formas y patrones. Hay formas en las que AI Text Classifier aprende por sí mismo y sigue mejorando a medida que profundiza en el contenido.

Dispersión lingüística natural. Esta táctica comprende el consumo de procedimientos como el escrutinio del sentimiento, denominado identificación de objetos, y la clasificación lingüística, para extraer datos evocadores del contenido. A continuación, el clasificador de IA utiliza estos datos para hacer una estimación aproximada sobre la fuente del contenido.

En cuanto a las limitaciones de la herramienta. AI Classifier no es fiable al 100%, ya que no puede detectar contenidos con total precisión. Hay ocasiones en las que el clasificador de IA etiquetará contenido escrito por humanos con contenido generado por IA, ya que es posible que después de que una herramienta de IA genere el texto, una persona pueda editarlo manualmente y retocarlo para que parezca escrito por un humano, lo que es difícil de detectar por la herramienta.

Bibliografía:

Greyling, Cobus. «Testing OpenAI’s New AI Text Classifier For Identifying AI-Written Content». Medium (blog), 1 de febrero de 2023. https://cobusgreyling.medium.com/testing-openais-new-ai-text-classifier-for-identifying-ai-written-content-7b2ec3c3a35.

Cubix. «How is AI Classifier Detecting AI-Generated Text», 8 de febrero de 2023. https://www.cubix.co/blog/ai-classifier-detecting-ai-generated-text.

OpenAI. «New AI Classifier for Indicating AI-Written Text», 31 de enero de 2023. https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/.

«The Makers of ChatGPT Have Launched a Tool to Detect Text Written With AI». Accedido 13 de febrero de 2023. https://www.freetech4teachers.com/2023/02/the-makers-of-chatgpt-have-launched.html.

Una marca de agua podría detectar los textos escritos por herramientas de Inteligencia Artificial como ChatGTP

«A Watermark for Chatbots Can Expose Text Written by an AI». MIT Technology Review. Accedido 29 de enero de 2023.

Ver completo

Los textos generados por inteligencia artificial podrían identificarse como tales mediante marcas ocultas, que nos permitirían saber si las palabras que leemos han sido escritas por un ser humano o no.

Estas «marcas de agua» son invisibles al ojo humano, pero permiten a los ordenadores detectar que el texto procede probablemente de un sistema de IA como ChatGTP. Si se incorporan a grandes modelos lingüísticos, podrían ayudar a evitar algunos de los problemas que estos modelos ya están causado.

Por ejemplo, desde que se lanzó en noviembre el chatbot ChatGPT de OpenAI, los estudiantes ya han empezado a hacer trampas utilizándolo para que escriba trabajos declase por ellos. El sitio web de noticias CNET ha utilizado ChatGPT para escribir artículos, pero ha tenido que corregirlos ante las acusaciones de plagio. Incorporar la marca de agua a estos sistemas antes de su lanzamiento podría ayudar a resolver estos problemas.

En algunos estudios, estas marcas de agua ya se han utilizado para identificar con casi total certeza textos generados por IA. Los investigadores de la Universidad de Maryland, por ejemplo, fueron capaces de detectar el texto creado por el modelo lingüístico de código abierto de Meta, OPT-6.7B, mediante un algoritmo de detección creado por ellos. El trabajo se describe en un artículo que aún no ha sido revisado por pares, este código estará disponible gratuitamente en torno al 15 de febrero.

«Ahora mismo estamos en el Salvaje Oeste», afirma John Kirchenbauer, investigador de la Universidad de Maryland que participó en el desarrollo de las marcas de agua. Kirchenbauer confía en que las herramientas de marca de agua den ventaja a los esfuerzos de detección de la IA. La herramienta que ha desarrollado su equipo podría adaptarse a cualquier modelo lingüístico de inteligencia artificial que prediga la siguiente palabra.

Los modelos lingüísticos de IA funcionan prediciendo y generando una palabra cada vez. Después de cada palabra, el algoritmo de marca de agua divide aleatoriamente el vocabulario del modelo lingüístico en palabras de una «lista verde» y una «lista roja» y, a continuación, pide al modelo que elija palabras de la lista verde.

Cuantas más palabras de la lista verde haya en un pasaje, más probable es que el texto haya sido generado por una máquina. El texto escrito por una persona suele contener una mezcla más aleatoria de palabras. Por ejemplo, para la palabra «bello», el algoritmo podría clasificar la palabra «flor» como verde y «orquídea» como roja. El modelo de IA con el algoritmo de marca de agua tendría más probabilidades de utilizar la palabra «flor» que «orquídea», explica Tom Goldstein, profesor adjunto de la Universidad de Maryland, que participó en la investigación.

ChatGPT forma parte de una nueva generación de grandes modelos lingüísticos que generan textos tan fluidos que podrían confundirse con la escritura humana. Estos modelos de IA Estos modelos de IA recopilan hechos por confianza, pero son famosos por arrojar falsedades y sesgos. Para un ojo inexperto, puede ser casi imposible distinguir un pasaje escrito por un modelo de IA de otro escrito por un ser humano. La vertiginosa velocidad de desarrollo de la inteligencia artificial hace que los nuevos modelos, más potentes, reduzcan rápidamente la eficacia de las actuales herramientas de detección de textos falsos. Es una carrera constante entre los desarrolladores de IA para crear nuevas herramientas de seguridad que puedan estar a la altura de la última generación de modelos de IA.

Letras impostoras: reflexiones sobre el plagio

Ochoa, Camilo Ayala. Letras impostoras Reflexiones sobre el plagio. Universidad Autónoma de Aguascalientes. Portal de libros de la Universidad Autónoma de Aguascalientes, 2023

Texto completo

El plagio es la forma superlativa del menosprecio. Existen autores plagiarios que confían que la revisión editorial o dictamen serán lo suficientemente laxos como para quedar impunes, también hay escritores que involuntariamente plagian; pero el proceso editorial implica la lectura, corrección, cotejo, revisión, marcaje y diseño de textos y, en este devenir, se detectan descuidos y transgresiones. En las editoriales interesadas en sus concurrencias lectoras, son varios los profesionales del libro que custodian la reputación del trayecto construido y la permanencia de la empresa. Los procesos editoriales son ejercicios de buena fe y siempre es posible que algo escape a todo un equipo editorial, pero la responsabilidad obliga a estar en guardia. La cultura editorial sólo puede tener como piso una cultura de la legalidad y, como cimiento, la probidad intelectual. Letras impostoras. Reflexiones sobre el plagio examina los tipos de plagio y plagiarios.