Archivo de la etiqueta: Plagios

Academ-AI, un proyecto que rastrea el uso no declarado de la inteligencia artificial en la literatura académica.

Academ-AI

https://www.academ-ai.info/

Academ-AI es un proyecto que documenta los efectos adversos del uso de inteligencia artificial (IA) en el ámbito académico, en particular, casos sospechosos de investigaciones redactadas con IA sin la debida declaración.

El sitio enumera artículos en los que se han detectado frases que sugieren fuertemente el uso de IA, las cuales se destacan en cada cita presentada. Los usuarios pueden reportar artículos que consideren incluidos erróneamente o enviar sospechas sobre otros trabajos.

Por el momento, la documentación se limita a artículos de revistas científicas y ponencias en congresos, excluyendo libros, capítulos de libros, preprints, blogs y otros medios.

Los textos generados por IA pueden identificarse por:

  • Frases características como “As of my last knowledge update…” o “As an AI language model…”.
  • Estilo conversacional que no encaja con la prosa académica.
  • Uso excesivo de pronombres en primera persona y marcadores discursivos como “ciertamente”.
  • Explicaciones extensas sobre limitaciones del conocimiento o referencias genéricas a expertos.

Si un artículo ha sido corregido por uso no declarado de IA, se etiqueta con el tipo de errata y la fecha de publicación. En casos donde los editores corrigen errores de IA sin notificar a los lectores, se marcan como “stealth revision” (revisión encubierta) sin fecha.

Se etiqueta cada artículo si pertenece a bases de datos reconocidas, como Web of Science, Scopus, PubMed Central, DOAJ, entre otras. También se validan los ISSN de las revistas y los ISBN de ponencias en congresos.

El papel central de la identidad digital en la integridad de la investigación

Member, Holly STM. 2024. «STM Report: Trusted Identity in Academic Publishing». STM Association. 31 de octubre de 2024.

Texto completo

El informe Trusted Identity in Academic Publishing: The Central Role of Digital Identity in Research Integrity, publicado por STM Solutions, aborda los desafíos emergentes en la confianza en la publicación académica debido al aumento de fraudes de identidad y violaciones de la integridad.

Tradicionalmente, el modelo de publicación académica se basa en una verificación mínima, lo que ha resultado inadecuado ante la proliferación de actividades fraudulentas, como los paper mills y la manipulación de identidades.

Durante siglos, la publicación académica se ha basado en la confianza, asumiendo implícitamente que los individuos que interactúan con una revista académica lo hacen de buena fe y dentro de las normas establecidas. Esta alta confianza significa que los investigadores generalmente no necesitan demostrar su identidad o buenas intenciones al presentar un artículo, actuar como revisores o unirse a un consejo editorial. De hecho, la mayoría de los editores solo requieren una dirección de correo electrónico funcional para participar en el proceso de envío y revisión.

Sin embargo, casos recientes de retiradas masivas de artículos debido a fraudes y un aumento de problemas de integridad en la investigación ilustran que esta confianza es cada vez más vulnerable a la explotación. Las paper mills y personas deshonestas han podido socavar estos procesos para obtener beneficios financieros o de reputación, contaminando el registro académico y llevando a un aumento considerable en las retiradas. Como resultado, hay una brecha entre el nivel de confianza que necesitan los sistemas editoriales y el nivel que los investigadores pueden proporcionar fácilmente.

Una solución instintiva es aumentar la seguridad en los accesos a las plataformas editoriales, insistiendo en controles de identidad similares a los requeridos para reservar un vuelo o alquilar un coche. Sin embargo, implementar estas medidas no es una tarea sencilla. Existen preocupaciones legítimas sobre aumentar la fricción para los investigadores honestos, el riesgo de excluir a aquellos que no pueden cumplir con estos controles y la privacidad del usuario.

Si bien los editores que mejoren sus controles de integridad pueden obtener una ventaja estratégica al proteger su reputación, es posible que algunos investigadores opten por revistas con medidas menos estrictas simplemente porque presentan menos obstáculos. Además, las inconsistencias entre los enfoques de los editores añaden complejidad al proceso de envío. Cualquier intento de encontrar una solución deberá bloquear o disuadir el fraude de manera efectiva mientras minimiza las cargas para los investigadores mediante un enfoque considerado y proporcional.

Este documento tiene como objetivo explicar el contexto de este tema y preparar el terreno para trabajos futuros que exploren posibles soluciones. También establece la dirección para investigar las formas más adecuadas de hacer realidad estas soluciones y proporcionar una manera de medir su efectividad.

El informe enfatiza la necesidad urgente de fortalecer la verificación de identidades sin crear obstáculos para los investigadores legítimos. Hylke Koers, CIO de STM Solutions, subraya que es esencial encontrar un equilibrio entre la integridad científica y la protección de los derechos de privacidad de los investigadores.

Además, el informe llama a la colaboración para desarrollar directrices y recomendaciones que permitan a editores y proveedores de sistemas editoriales combatir el fraude mientras mantienen la inclusividad en la investigación académica. La comunidad está invitada a revisar el informe hasta el 30 de noviembre y proporcionar comentarios sobre cómo las soluciones de identidad digital pueden apoyar la confianza en la investigación en un panorama en constante cambio.

Uno de cada siete artículos científicos podría ser al menos parcialmente falso

James Heathers, «How much science is fake? approximate 1 in 7 Scientific Papers Are Fake», 22 de septiembre de 2024, https://doi.org/10.17605/OSF.IO/5RF2M.



Un nuevo análisis realizado por James Heathers sugiere que uno de cada siete artículos científicos podría ser al menos parcialmente falso. Este estudio, publicado el 24 de septiembre en el Open Science Framework antes de la revisión por pares, se basó en datos de 12 estudios previos que analizaron aproximadamente 75.000 artículos. Heathers critica la cifra del 2% de fraude que se ha citado desde un estudio de 2009, argumentando que está desactualizada.

En 2009, un estudio ampliamente citado reveló que alrededor del 2% de los científicos admitían haber falsificado, fabricado o modificado datos en algún momento de su carrera. Esta cifra ha sido utilizada con frecuencia para ilustrar el problema del fraude en la ciencia. Sin embargo, 15 años después, James Heathers, investigador afiliado en psicología en la Universidad Linnaeus de Växjö, Suecia, decidió cuestionar esa cifra y ofrecer una estimación más actualizada y precisa. En su nuevo análisis, publicado el 24 de septiembre en el Open Science Framework antes de la revisión por pares, Heathers sugiere que uno de cada siete artículos científicos puede ser al menos parcialmente falso.

Heathers, conocido por su labor como «detective científico», llegó a esta conclusión al promediar datos de 12 estudios existentes. Estos estudios, que abarcan áreas como las ciencias sociales, la medicina y la biología, analizaron alrededor de 75.000 artículos para estimar el volumen de trabajos problemáticos. A través de una combinación de herramientas en línea que detectan irregularidades, Heathers encontró una «similitud persistente» entre las estimaciones de estos estudios y concluyó que, en promedio, uno de cada siete trabajos presenta errores o fraudes significativos.

Críticas a las estimaciones anteriores

Heathers explica que la cifra del 2% de fraude que proviene del estudio de 2009 está desactualizada, ya que el último conjunto de datos utilizado en ese estudio proviene de 2005. Durante los últimos 20 años, el entorno académico ha cambiado significativamente, y Heathers considera que esta cifra ya no refleja adecuadamente la magnitud del problema actual. Además, critica los enfoques anteriores que se centraban en preguntar directamente a los científicos si habían participado en prácticas deshonestas, calificando este método como ineficaz y poco fiable.

«Heathers señala que es ingenuo preguntar a los investigadores que cometen fraude si admitirán sus malas prácticas. En su lugar, propone utilizar herramientas más objetivas y datos indirectos para medir la magnitud del problema.»

Un enfoque «salvajemente no sistemático»

El propio Heathers reconoce que su estudio es «salvajemente no sistemático», ya que los datos que utilizó provienen de múltiples áreas y metodologías, y no existe un análisis homogéneo o riguroso que abarque todo el problema. Aun así, justifica su enfoque argumentando que esperar los recursos necesarios para realizar un análisis exhaustivo y sistemático tomaría demasiado tiempo, y que es importante comenzar a abordar el problema con los datos disponibles.

A pesar de sus limitaciones, Heathers decidió realizar un meta-análisis, ya que las cifras disponibles sobre la cantidad de ciencia fraudulenta son escasas. A su juicio, aunque se realice una revisión sistemática más formal, es probable que los resultados no difieran significativamente de su estimación preliminar de que uno de cada siete artículos es falso.

Críticas de otros expertos

El estudio ha recibido críticas de algunos expertos en la comunidad científica. Daniele Fanelli, un metacientífico de la Universidad Heriot-Watt en Edimburgo, Escocia, y autor del estudio de 2009, no está convencido de los resultados del nuevo análisis. Fanelli sostiene que el estudio de Heathers mezcla estudios que miden diferentes fenómenos y utiliza metodologías distintas, lo que puede llevar a conclusiones erróneas. Para Fanelli, etiquetar cualquier estudio con algún problema como «falso» no es un enfoque riguroso y podría llevar a una interpretación distorsionada del alcance real del fraude en la ciencia.

Fanelli también expresó su preocupación de que el estudio pueda atraer atención negativa e innecesaria de los medios, lo cual podría afectar la percepción pública de la ciencia sin un beneficio tangible para el campo.

Por su parte, Gowri Gopalakrishna, epidemióloga de la Universidad de Maastricht en los Países Bajos, también expresó reservas sobre las conclusiones de Heathers. Gopalakrishna coautorizó un estudio en 2021 que encontró que el 8% de los investigadores en una encuesta de casi 7.000 científicos en los Países Bajos admitieron haber falsificado o fabricado datos entre 2017 y 2020. Sin embargo, Gopalakrishna cree que la prevalencia del fraude puede variar significativamente entre diferentes campos de estudio, y agrupar todas las disciplinas bajo una misma cifra podría ser poco útil y conducir a interpretaciones erróneas.

Una amenaza existencial para la ciencia

A pesar de las críticas, Heathers sostiene que el problema del fraude en la ciencia representa una amenaza existencial para el campo y debe abordarse de inmediato. Argumenta que los científicos, las instituciones científicas y los organismos de financiación deben reconocer la gravedad del problema y actuar en consecuencia. El hecho de que un número significativo de publicaciones científicas pueda estar contaminado por fraudes o errores serios socava la confianza en el proceso científico y pone en riesgo el progreso del conocimiento.

Heathers también destaca que el fraude en la ciencia está «crucialmente subfinanciado» en términos de investigación y vigilancia, lo que agrava el problema. Aunque su estudio no es exhaustivo, espera que su trabajo sirva como un primer paso para abordar una cuestión que ha sido pasada por alto durante demasiado tiempo.

¿Cómo saber si lo que lees lo ha escrito una IA?

Peterson, Jake. «How to Tell If What You’re Reading Was Written By AI». Lifehacker, 12 de agosto de 2024. https://lifehacker.com/tech/how-to-tell-if-what-youre-reading-was-written-by-ai.

Desde que ChatGPT introdujo la IA generativa en 2022, ha quedado claro que ya no se puede confiar en que todo lo que lees fue escrito por un humano. La IA puede generar textos de manera rápida y convincente, pero ¿cómo puedes estar seguro de que no proviene de un algoritmo?

Aunque algunos han adoptado esta tecnología, otros la rechazan. Incluso medios como CNET y G/O Media han enfrentado críticas por publicar contenido generado por IA debido a su calidad deficiente.

Los modelos de lenguaje, como GPT, no son conscientes ni inteligentes; simplemente predicen secuencias de palabras basadas en grandes conjuntos de datos. No obstante, existen señales que pueden delatar un texto generado por IA.

  1. Uso de palabras y frases comunes: Las IA suelen repetir ciertas palabras como «explorar», «destacar» o «testimonio». Aunque son válidas, el uso frecuente de estas puede ser una señal de texto generado por IA.
  2. Estilo de escritura: La IA tiende a usar un lenguaje grandilocuente y repetitivo, con descripciones floridas que no suelen aportar profundidad a los argumentos.
  3. Verificación de hechos y corrección: La IA puede cometer errores al «alucinar» hechos, generando información incorrecta. Además, los textos de IA suelen ser perfectos en cuanto a gramática, lo cual puede ser otra señal.

Aunque existen detectores de textos generados por IA, no siempre son confiables. La mejor manera de identificar un texto escrito por IA sigue siendo el análisis detallado.

El mercado negro de las citas: la venta de referencias falsas alarma a los científicos

Singh Chawla, D. (2024). The citation black market: Schemes selling fake references alarm scientists. Nature. https://doi.org/10.1038/d41586-024-01672-7

Un grupo de científicos ha revelado un mercado negro donde se venden citaciones falsas para inflar perfiles académicos, lo que plantea serias preocupaciones sobre la integridad en la investigación. Estos esquemas manipulan métricas cruciales para la evaluación académica, como el índice h. Expertos sugieren cambiar los incentivos en la academia para evitar que los investigadores se vean presionados a participar en estas prácticas fraudulentas.

Vigilantes de la integridad en la investigación están preocupados por las crecientes maneras en que los científicos pueden inflar artificialmente el número de citaciones de sus estudios. En los últimos meses, han surgido prácticas cada vez más audaces. Una de estas prácticas fue descubierta mediante una operación encubierta en la que un grupo de investigadores compró 50 citaciones por 300$ para mejorar el perfil de Google Scholar de un científico ficticio que crearon.

Este caso confirma la existencia de un mercado negro de referencias falsificadas, algo que los expertos en integridad habían sospechado durante mucho tiempo. Las citaciones compradas provienen de estudios en 22 revistas, de las cuales 14 están indexadas en Scopus.

Estas prácticas son preocupantes porque muchos aspectos de la carrera de un investigador dependen de la cantidad de citaciones que reciben sus trabajos. Instituciones y métricas como el índice h utilizan estos números para evaluar la productividad y el impacto de los científicos. En un caso reciente en España, el rector de la Universidad de Salamanca fue acusado de inflar artificialmente sus métricas de Google Scholar, lo que llevó a una investigación por parte del Comité de Ética en la Investigación.

La operación encubierta también descubrió que se venden citaciones en «paper mills», servicios que producen estudios de baja calidad y venden autorías en artículos ya aceptados. Además, se ha observado la creación de perfiles falsos, como el de un gato llamado Larry, que acumuló citaciones antes de que Google Scholar y ResearchGate eliminaran las publicaciones falsas.

El equipo de investigadores propone un nuevo índice de concentración de citaciones para detectar patrones sospechosos, como cuando un científico recibe muchas citaciones de pocas fuentes. Sin embargo, persiste el temor de que los estafadores desarrollen métodos más sutiles para evitar ser descubiertos. Según los expertos, para abordar este problema, es necesario cambiar los incentivos en la academia para que los científicos no se vean presionados a acumular citaciones para avanzar en sus carreras.

Las falsas reescrituras de libros generadas por IA inundan Amazon

Knibbs, Kate. 2024 «Scammy AI-Generated Book Rewrites Are Flooding Amazon». Wired. Accedido 15 de enero de 2024. https://www.wired.com/story/scammy-ai-generated-books-flooding-amazon/.

Los reescritos de libros generados por IA que parecen ser fraudulentos están inundando Amazon. Los autores siguen descubriendo lo que parecen ser imitaciones generadas por IA y resúmenes de sus libros en Amazon. Hay poco que puedan hacer para frenar las copias fraudulentas.


La proliferación de reescrituras de libros generadas por inteligencia artificial que parecen fraudulentas está afectando significativamente a Amazon, y los autores siguen descubriendo lo que aparentan ser imitaciones y resúmenes generados por IA de sus libros en la plataforma. Este problema ha afectado a la investigadora de IA Melanie Mitchell y a otros profesionales, generando preocupaciones en la comunidad literaria. Aunque Amazon actuó retirando la imitación del libro de Mitchell, la presencia persistente de resúmenes de baja calidad generados por IA sigue siendo un desafío.

Mitchell notó que, al buscar su libro en Amazon, no solo encontraba su obra, sino también otro libro electrónico con el mismo título, publicado en septiembre pasado. Este tenía solo 45 páginas y reproducía las ideas de Mitchell en un lenguaje entrecortado y torpe. El autor listado, «Shumaila Majid», carecía de biografía, foto y presencia en internet, pero al hacer clic en ese nombre, aparecían numerosos libros similares resumiendo títulos recién publicados.

Este fenómeno afecta a diversos autores, entre ellos la pionera en ciencias de la computación Fei-Fei Li, cuyo nuevo libro tiene más de una docena de reescrituras aparentemente generadas por IA. Aunque algunos de estos resúmenes se presentan como tales, a menudo no aportan un valor significativo para los lectores. A diferencia del libro de Mitchell, los resúmenes de Li se anuncian como tales. Uno, titulado abiertamente «Resumen y Análisis de The Worlds I See», tiene una descripción del producto que comienza así: «¡DESCARGO DE RESPONSABILIDAD! ESTO NO ES UN LIBRO DE FEI-FEI LI, NI ESTÁ AFILIADO A ELLOS. ES UNA PUBLICACIÓN INDEPENDIENTE QUE RESUME EL LIBRO DE FEI-FEI LI EN DETALLES. ES UN RESUMEN». Defender analizó una muestra del libro de Resumen y Análisis y también encontró que probablemente fue generado por IA.

La aparición de resúmenes generados por IA ha aumentado significativamente, a pesar de que en septiembre de 2023, Amazon limitó a los autores a cargar un máximo de tres libros al día en su tienda. La escritora Sarah Stankorb es una de las afectadas. Este verano, publicó «Disobedient Women: How a Small Group of Faithful Women Exposed Abuse, Brought Down Powerful Pastors, and Ignited an Evangelical Reckoning». Los resúmenes aparecieron en Amazon en cuestión de días. Uno, que sospecha que se basó en una copia avanzada comúnmente distribuida a revisores, apareció el día antes de que saliera su libro.

Los resúmenes generados por IA vendidos como libros electrónicos han estado «aumentando dramáticamente en número», según Jane Friedman, experta en la industria editorial, quien también fue blanco de un esquema de libros generados por IA diferente. «Es común en este momento que un autor de no ficción celebre el lanzamiento de su libro y luego, en pocos días, descubra uno de estos resúmenes a la venta».

Este problema se agrava debido a las limitadas acciones de Amazon para abordar la situación. Aunque la compañía retiró la imitación del libro de Mitchell, no ha anunciado planes para monitorear proactivamente esta ola de resúmenes. La falta de medidas efectivas actualmente permite que los creadores de estos resúmenes continúen subiéndolos a la plataforma. Stankorb describe la situación como una nueva realidad y la resignación de la industria editorial ante este persistente problema.

Citar vs. Plagiar: citas y referencias. Recomendaciones y aspectos básicos del estilo APA

 
 

citasyreferencias-213x300

Quevedo-Pacheco, N. (2014). [e-Book] Citar vs. Plagiar: citas y referencias. Recomendaciones y aspectos básicos del estilo APA (3a ed. en español, 6a. ed. en inglés), Biblioteca de la Universidad de Lima, 2014.

Texto completo

1. ¿Qué es plagiar?. ¿Por qué plagiamos?. ¿Cómo evitamos plagiar?. 2. ¿Qué es citar?. ¿Qué se debe citar?. ¿Cómo se cita?. 3. ¿Qué es el derecho de autor?. 4. Diferencias entre citas, referencias y bibliografía. 5. Citas y referencias según APA, 3ª ed. en español. 6. Elementos básicos de un artículo según APA