Archivo de la etiqueta: Lenguaje

La huella de la Inteligencia Artificial en la escritura académica: un análisis del cambio lingüístico tras los LLMs

Kousha, Kayvan, and Mike Thelwall. “How Much Are LLMs Changing the Language of Academic Papers after ChatGPT? A Multi-Database and Full Text Analysis.” arXiv (September 2025). https://arxiv.org/abs/2509.09596

El artículo analiza cómo los modelos de lenguaje grande (LLMs), en particular tras la aparición pública de ChatGPT, están influyendo en el estilo lingüístico de los artículos académicos.

Para ello, los autores se centran en doce términos muy característicos de los textos generados o corregidos con LLMs —como delve, underscore, intricate o meticulous— y estudian su evolución en seis grandes bases de datos: Scopus, Web of Science, PubMed, PubMed Central (PMC), Dimensions y OpenAlex. Además, aplican un análisis exhaustivo a más de 2,4 millones de artículos de PMC publicados entre 2021 y mediados de 2025.

Los resultados muestran un crecimiento espectacular en la frecuencia de estos términos tras la popularización de ChatGPT. Por ejemplo, entre 2022 y 2024, delve aumentó cerca de un 1500 %, underscore un 1000 % e intricate un 700 %. En los textos completos de PMC, el uso de underscore seis o más veces en un artículo se disparó más de un 10.000 % entre 2022 y 2025. También destacan los aumentos de intricate (≈ 5400 %) y meticulous (≈ 2800 %).

El fenómeno no afecta de igual manera a todas las disciplinas. El crecimiento es mucho mayor en áreas STEM (Ciencia, Tecnología, Ingeniería y Matemáticas) que en Ciencias Sociales o en Artes y Humanidades. Asimismo, los autores detectan que la co-ocurrencia de estos términos es cada vez más fuerte: artículos que emplean underscore tienden también a incluir con mayor frecuencia pivotal o delve, mostrando correlaciones que en 2022 eran casi inexistentes.

Se evidencia que la influencia de ChatGPT y otros LLMs se percibe claramente en el lenguaje académico, no solo en la frecuencia de ciertos términos, sino también en un estilo más uniforme y “pulido”. Este fenómeno puede ayudar a investigadores no nativos en inglés a acercarse a los estándares de redacción científica, reduciendo barreras lingüísticas en la publicación internacional. Sin embargo, también plantean interrogantes sobre el riesgo de homogeneización, exceso de artificio o pérdida de diversidad estilística en la escritura académica.

La inteligencia artificial (IA) está influyendo en nuestro vocabulario

Cambridge University Press & Assessment. 2025. “Cambridge Dictionary Tracks New AI Words.” Cambridge University Press & Assessment Newsroom, 24 de junio de 2025. https://www.cambridge.org/news-and-insights/cambridge-dictionary-tracks-new-ai-words

El 24 de junio de 2025, Cambridge Dictionary publicó una nota destacando cómo la inteligencia artificial (IA) está influyendo en nuestro vocabulario. El equipo de lexicógrafos de Cambridge ha estado monitoreando de cerca los términos emergentes relacionados con la IA, seleccionando aquellos que reflejan tendencias lingüísticas recientes

Entre los nuevos términos rastreados se encuentran expresiones como “slop”, utilizado para referirse a contenido de baja calidad generado por IA; “AI washing”, que describe prácticas corporativas que pretenden parecer impulsadas por IA sin serlo realmente; y “decel”, una abreviatura que alude a la desaceleración en el desarrollo o adopción de tecnologías de IA. Estas inclusiones reflejan la rápida aparición de vocablos vinculados a debates sobre la calidad, autenticidad y progreso tecnológico en IA.

La entrada de “slop” es particularmente notable: Cambridge Dictionary ha actualizado su definición para incluir esta acepción asociada a la IA—contenido pobre o irrelevante producido por algoritmos—lo cual evidencia una creciente preocupación pública por el exceso y baja calidad de determinados resultados generados automáticamente .

Este seguimiento sistemático forma parte de una estrategia continua: Cambridge Dictionary registra y evalúa semanalmente nuevos términos relacionados con IA (“newly emerging words”), muchos de los cuales luego se incorporan a su base de datos principal. Así, lexicógrafos aseguran que el diccionario responda con agilidad a los cambios en el uso del inglés, especialmente en contextos tecnológicos de rápida evolución.

Con más de 170.000 definiciones y millones de visitas anuales, Cambridge Dictionary refuerza así su papel como referencia global para aprendizajes de idioma, incorporando sistemáticamente vocabulario contemporáneo de la era digital .

«Declaración sobre el lenguaje ofensivo» para reconocer y abordar el lenguaje problemático en el catálogo de la biblioteca

Newlin, Rachel, and Aaron Bock. «Addressing Harmful Language in Library Metadata and CollectionsJournal of Library and Information Science, 2022 https://americanlibrariesmagazine.org/2025/01/02/words-matter/

En los últimos años, bibliotecarios y archiveros han mostrado preocupación por el lenguaje ofensivo o desactualizado en metadatos y colecciones. En 2022, la Biblioteca del Distrito de Schaumburg Township (STDL) en Illinois adoptó una declaración sobre contenido dañino para reconocer y abordar el lenguaje problemático en su catálogo.

En 2022, la Biblioteca del Distrito de Schaumburg Township (STDL) en Illinois adoptó una declaración sobre contenido dañino—también conocida como «declaración sobre lenguaje dañino» o «declaración sobre contenido dañino»—para reconocer y abordar el lenguaje problemático en el catálogo de la biblioteca. Estas declaraciones ayudan a las bibliotecas a enfocarse en describir los materiales de manera respetuosa e informada por sus comunidades. La declaración debe ser un catalizador para conversaciones significativas sobre diversidad, equidad e inclusión.

La STDL es una de las muchas bibliotecas que han implementado políticas similares para abordar el lenguaje problemático en sus colecciones. Por ejemplo, la Biblioteca Pública de Chicago ha revisado sus políticas de adquisición y catalogación para garantizar que sus colecciones sean inclusivas y respetuosas. Además, la Biblioteca del Congreso de los Estados Unidos ha trabajado en la actualización de sus registros bibliográficos para eliminar términos ofensivos y promover un lenguaje más inclusivo.

Estas iniciativas reflejan un esfuerzo más amplio en la comunidad bibliotecaria para reconocer y rectificar el lenguaje que puede ser perjudicial o excluyente, promoviendo así un entorno más inclusivo y respetuoso para todos los usuarios.

Declaración sobre Contenido Dañino de STDL


Nuestra colección, al igual que nuestra comunidad, es diversa y dinámica. Parte de la organización de los materiales en nuestra colección incluye el uso de metadatos y descripciones estandarizadas en nuestro catálogo. En la biblioteca, nos comprometemos a crear descripciones inclusivas que describan con precisión nuestros materiales. Sin embargo, reconocemos que puede haber lenguaje en las descripciones de nuestra colección que esté desactualizado, sea insensible o inexacto. Tales descripciones no reflejan el punto de vista de la biblioteca, sino las actitudes sociales y circunstancias del período o lugar en el que fueron creadas. Nos dedicamos a encontrar formas de mitigar el uso de lenguaje dañino en las descripciones de nuestro catálogo.

Reconocemos que a menudo estamos describiendo comunidades de las que no formamos parte. Reconocemos nuestra responsabilidad de describir nuestra colección de manera respetuosa y cuidadosa. También reconocemos que en ocasiones podemos fallar y estamos comprometidos con un proceso de reflexión constante y mejora.

¿Cómo se describen los materiales y por qué algunas descripciones son dañinas?

Al procesar nuestras colecciones, el personal toma decisiones sobre qué lenguaje utilizar para describir nuestros materiales. Algunas de estas descripciones fueron escritas hace muchos años, utilizando un lenguaje que era aceptable en su momento. Los bibliotecarios a menudo utilizan un conjunto estándar de términos, como las Encabezamientos de Materias de la Biblioteca del Congreso, para describir los materiales. Algunos de estos términos estandarizados están desactualizados, son ofensivos o insensibles. A veces, el personal comete errores o usa un juicio inapropiado. Estamos comprometidos a trabajar para mejorar el acceso y actualizar las descripciones que sean dañinas.

¿Cómo estamos trabajando para abordar este problema y ayudar a los usuarios a entender mejor este contenido?

  • Trabajando directamente con comunidades mal representadas y subrepresentadas para mejorar la forma en que son representadas.
  • Informando a los usuarios sobre la presencia y el origen del contenido dañino.
  • Proponiendo cambios y adiciones a los vocabularios estándar para promover un acceso más inclusivo y preciso a las obras.
  • Implementando vocabularios de sistemas alternativos de vocabulario y clasificación.
  • Incluyendo metadatos descriptivos en el guion original de obras en lenguas que no usan el alfabeto latino.
  • Favoreciendo los términos usados por las comunidades e individuos descritos en nuestras colecciones.
  • Participando en discusiones continuas dedicadas a examinar nuestro legado y prácticas históricas de catalogación.

¿Cómo puedo reportar contenido dañino?

Mantener una descripción actualizada y precisa de los materiales es un proceso continuo y no siempre tomamos las decisiones correctas. Fomentamos la retroalimentación de todos los miembros de nuestra comunidad, para que podamos aprender y ajustar nuestras prácticas.

Fuente: Schaumburg Township (Ill.) District Library

Los esfuerzos por ayudar a bibliotecas, archivos y museos a sustituir términos nocivos por un lenguaje apropiado para referirse a los pueblos indígenas

Respectful Terminologies Project

https://www.nikla-ancla.com/projects

Los esfuerzos por ayudar a bibliotecas, archivos y museos a sustituir términos nocivos por un lenguaje apropiado para referirse a los pueblos indígenas están cobrando fuerza.

En Canadá, el Respectful Terminologies Project (Proyecto de Terminologías Respetuosas) ha obtenido recientemente financiación inicial para empezar a crear una plataforma abierta en línea de vocabulario preferido para describir a las personas, los lugares, el patrimonio, las tradiciones, los conocimientos y la cultura indígenas. El objetivo es sustituir un lenguaje culturalmente insensible y arraigado en el colonialismo por descripciones más apropiadas que reflejen las diversas comunidades.

El proyecto de la National Indigenous Knowledge and Language Alliance (NIKLA) está codirigido por Stacy Allison-Cassin, ciudadana de la Nación Métis de Ontario y profesora adjunta de la Universidad Dalhousie de Nueva Escocia, y Camille Callison, miembro de la Nación Tahltan y bibliotecaria universitaria de la Universidad del Valle de Fraser en Columbia Británica.

El proyecto comienza con un apoyo inicial de casi 400.000 dólares canadienses de varias organizaciones: Library and Archives Canada (LAC), Canadian Heritage Information Network (CHIN), Canadian Association of Research Libraries (CARL), Canadian Urban Library Council (CULC), Canadian Research Knowledge Network (CKRN), Internet Archive Canada y OCLC. A medida que el trabajo continúa, NIKLA busca contribuciones y colaboraciones adicionales. Para obtener más información o apoyar la iniciativa, visite la página del proyecto NILKA aquí.

Las bibliotecas universitarias de la Universidad de Maryland abordan el lenguaje nocivo en los registros del catálogo

Libraries addresses harmful language in catalog records
New Harmful Language Statement seeks to contextualize, remediate harm
. University of Maryland, 2022

Ver anuncio

En las bibliotecas universitarias y los espacios de archivo de todo el país se están creando declaraciones sobre el lenguaje nocivo para ayudar a contextualizar por qué el lenguaje nocivo, como los insultos raciales, existe en los catálogos de las bibliotecas. Este otoño, cuando navegue por nuestras colecciones o busque en Worldcat, es posible que observe un enlace a la nueva declaración de lenguaje nocivo de las bibliotecas.

«Si alguien que utiliza el catálogo de la biblioteca ve palabras nocivas en el título de un recurso o en otra información, puede no sentirse bienvenido en la biblioteca o puede pensar que los empleados de la biblioteca apoyan las creencias escritas en ese recurso nocivo», dice Andrea Schuba, la bibliotecaria de catalogación de monografías que dirigió el grupo de empleados de la biblioteca para crear la declaración.

Como bibliotecaria, Schuba ha catalogado libros y otros materiales que contienen insultos racistas y otro tipo de lenguaje dañino en sus títulos y ha sentido la necesidad de explicar por qué la colección de la biblioteca contenía estos artículos.

La nueva declaración hace dos puntos con el objetivo de remediar el daño y contextualizar el lenguaje dañino. La declaración también proporciona un mecanismo para proporcionar información sobre las descripciones que los empleados de catalogación de la biblioteca pueden cambiar. A menudo, se trata de palabras que se encuentran en los resúmenes de los materiales.

La declaración también explica por qué el lenguaje nocivo no se censura cuando se transcribe directamente de una fuente. El lenguaje exacto aporta un contexto importante a los investigadores, ya que les permite comprender las opiniones de los creadores originales. A menudo, esto también proporciona un contexto para los acontecimientos y resultados históricos que todavía afectan a poblaciones enteras en la actualidad.

Fascinación y confusión: el uso de un lenguaje accesible en la alfabetización informacional de los estudiantes

 

img_2504-adj

 

Valerie A Lynn, Bonnie Imler. Librarian Fascination and Student Confusion with “RE” words: Research, Reference, Resources, and Reserves. Pennsylvania Libraries: Research and Practice Vol. 8, Núm. 1 (2020) 

Texto completo

La confusión de los estudiantes con respecto al uso de la jerga utilizada por los bibliotecarios en los sitios web, durante las sesiones de instrucción y en la misma conversación no es nuevo; sin embargo, cuatro términos de uso común recientemente han perdido contexto tanto dentro como fuera de la configuración de la biblioteca. Coincidentemente, las cuatro palabras comienzan con «RE»: investigación (research), referencia, recursos y reservas. Al preguntar a un grupo de estudiantes qué creen que significan estas palabras «RE», se obruvo una indicación más clara de sus percepciones y necesidades de información específicas. Encontrar una base lingüística común por parte de la biblioteca reduciría las barreras y promovería una mejor la comprensión y satisfacción de los estudiantes.

La importancia del lenguaje en el entorno biosanitario

 

monografia-lenguaje

 

Gutiérrez Rodilla, Berta ; Navarro, F. A. La importancia del lenguaje en el entorno biosanitario. Fundación Dr. Antonio Esteve, 2014

Texto completo

 

El papel del lenguaje en las ciencias de la salud es clave en el día a día del profesional sanitario y merece mucho más protagonismo del que habitualmente recibe. Por eso, 14 expertos abordan en una nueva monografía de la Fundación Dr. Antonio Esteve los diferentes ámbitos de la salud en los que el lenguaje juega una función determinante.

La comunicación entre colegas investigadores, la consulta con los pacientes, las aulas y la divulgación científica. Son las diferentes etapas en la carrera de un profesional biosanitario que se analizan desde el punto de vista lingüístico en el libro La importancia del lenguaje en el entorno biosanitario, coordinado por el prestigioso traductor médico Fernando A. Navarro, autor del Diccionario de dudas y dificultades de traducción del inglés médico, y por la profesora de lenguaje médico de la Universidad de Salamanca Bertha M. Gutiérrez Rodilla.

Abre el apartado sobre el lenguaje en el ámbito asistencial el pediatra José Ignacio de Arana, que pide a sus colegas de profesión una mayor claridad y exactitud en el uso de la palabra con sus pacientes, sobre todo en el pronóstico. “Nuestro lenguaje debe descender desde el olimpo de la ciencia a la lengua coloquial”, reclama. Por su parte, Bárbara Navaza, de la International Medical Interpreters Association, ilustra sobre dos disciplinas, la interpretación sanitaria y la mediación cultural, que son de vital importancia para garantizar la comunicación médico-paciente en un país con más de seis millones de extranjeros empadronados.

Abordando el lenguaje en el ámbito de la investigación, Juan Aréchaga, catedrático de biología celular de la Universidad del País Vasco, defiende que el castellano sólo logrará convertirse en idioma internacional de la ciencia si lo hace desde revistas de alcance global. Jesús Porta Etessam, director del área de cultura de la Sociedad Española de Neurología, recomienda a las revistas en español que utilicen todos los recursos y la tecnología para promocionar a sus autores.

El lenguaje en la docencia, tercer bloque del libro, lo examinan Josep-Eladi Baños y Elena Guardiola, ambos del departamento de ciencias experimentales y de la salud de la Universitat Pompeu Fabra. “Hablar y escribir correctamente no debería constituir un objetivo secundario de los profesores universitarios”, concluyen. Otras dos expertas en el manejo del lenguaje médico en las aulas, Bertha Gutiérrez (Universidad de Salamanca) y Carmen Quijada (Casa de las Lenguas de la Universidad de Oviedo), han luchado por diseñar dos competencias terminológicas que deberían asumir los alumnos al terminar la carrera y por una futura asignatura sobre lenguaje biosanitario.

El último bloque se centra en los medios de comunicación. El periodista Gonzalo Casino propone para frenar el declive de la información científica una mayor especialización de los profesionales y la elaboración de un libro de estilo del periodismo médico con un glosario de los términos más problemáticos. Javier González de Dios, responsable del blog Pediatría basada en pruebas, advierte a los científicos que no les queda otro remedio que unirse a las tecnologías de la información y la comunicación, siempre que lo hagan con el mismo lenguaje preciso que utilizarían por otros medios.

Aprendizaje automático: una máquina lee 3.5 millones de libros para caracterizar los adjetivos asociados a hombres y mujeres

medium_jsrnhtviwvejrnvmer-gfv20pekaqivvqa3p7akuqxw

Alexander Hoyle , Lawrence Wolf-Sonkin , Hanna Wallach , Isabelle Augenstein , Ryan Cotterell. Unsupervised Discovery of Gendered Language through Latent-Variable Modeling. In Proceedings of the Annual Meeting of the Association for Computational Linguistics, 2019

Texto completo

 

Estudiar en qué medida el lenguaje que utilizamos es específico de género ha sido durante mucho tiempo un área de interés en sociolingüística. En este trabajo se analiza este fenómeno, para cuantificar el grado en que el lenguaje utilizado para describir a hombres y mujeres es diferente, y además, diferente de manera positiva o negativa. Encontramos que existen diferencias significativas entre la forma en que se describen los sustantivos masculinos y femeninos, lo que está en consonancia con los estereotipos de género más comunes: Los adjetivos positivos usados para describir a las mujeres tienen más probabilidades de estar relacionados con el cuerpo de una persona que los adjetivos que describen a los hombres.

 

Una máquina leyó 3.5 millones de libros y luego contó lo que pensaba sobre hombres y mujeres para descubrir que los adjetivos atribuidos a las mujeres tienden a describir la apariencia física, mientras que las palabras que se refieren al comportamiento se atribuyen a los hombres.

«Hermoso» y «sexy» son dos de los adjetivos más utilizados para describir a las mujeres. Los descriptores de uso común para los hombres incluyen justos, racionales y valientes.

Los investigadores revisaron una enorme cantidad de libros en un esfuerzo por descubrir si hay una diferencia entre los tipos de palabras que describen a hombres y mujeres en la literatura. Utilizando un nuevo modelo de computadora, los investigadores analizaron un conjunto de datos de 3.5 millones de libros, todos publicados en inglés entre 1900 y 2008. Los libros incluyen una mezcla de literatura de ficción y no ficción.

Podemos ver claramente que las palabras utilizadas para las mujeres se refieren mucho más a sus apariencias que las palabras utilizadas para describir a los hombres. Por lo tanto, hemos podido confirmar una percepción generalizada, solo que ahora a nivel estadístico ”, dice la científica informática y profesora asistente Isabelle Augenstein, del departamento de informática de la Universidad de Copenhague.

Importancia de la comprensión del lenguaje de la Alfabetización Informacional

b98e37113b716fedb21dc2fede949285

 

Orgeron, J.-P. «Understanding the Language of Information Literacy.» The Journal of Academic Librarianship vol. 44, n. 1 (2018). pp. 81-87. http://www.sciencedirect.com/science/article/pii/S0099133317302707

Para el uso eficaz de los recursos de la biblioteca es necesario comprender el lenguaje de los conocimientos básicos en materia de información. Los resultados de un estudio reciente indican que los estudiantes universitarios carecen de esa comprensión, y los autores recomiendan que los bibliotecarios, en colaboración con el profesorado, vuelvan a evaluar los términos de la alfabetización informativa. Este artículo examina lo que implica reevaluar estos términos basándose en varias ideas de la filosofía del lenguaje, que proporciona una base para comprender los desafíos semánticos a los que se enfrentan los bibliotecarios en la formación de los usuarios. Toda reevaluación de los términos relativos a la adquisición de competencias básicas en materia de información debería reconocer su uso ordinario y especializado y apuntar a la expresión holística de los conceptos básicos, por complejos que sean.

 

El problema del lenguaje en la Bibliotecología

27015111522_4a69e49e01_n_d

Rendón Rojas, M. Á. ( cord.). [e-Book] El problema del lenguaje en la bibliotecología / ciencia de la información / documentación. Un acercamiento filosófico-teórico (Investigación realizada gracias al Programa UNAM-DGAPA-PAPIIT. Proyecto IN 401311)México, UNAM, 2014.

Texto completo

El lenguaje no es únicamente el instrumento mediador entre los objetos y las personas, sino un fenómeno vivo que, al mismo tiempo, representa un componente y constructor de las culturas. Las voces que designan objetos, ideas, conceptos, sentimientos, poseen su propio devenir dentro del cual influyen a la sociedad y son influidos por ella. El lenguaje de la ciencia no escapa a esa dinámica, y la presente obra analiza esa problemática en lo concerniente al lenguaje de la Bibliotecología / Ciencia de la Información / Documentación. El centro de la reflexión gira en torno a las preguntas: ¿es posible encontrar un consenso en ese lenguaje? ¿Cuáles son las razones, elementos y factores que justifican la posibilidad de ese consenso? Dentro del aparato conceptual de la ciencia que estudia el fenómeno informativo documental, ¿cuáles conceptos representan las categorías más importantes y cuál es su contenido? ¿Cuáles son las causas que originan la diversidad terminológica y conceptual en esa área del conocimiento? No prometemos respuestas últimas y completas, pero sí un interesante camino en la búsqueda de puntos de referencia que nos orienten en los múltiples juegos del lenguaje bibliotecológico.