Archivo de la etiqueta: Multilingüismo

Recomendaciones de COAR para promover buenas prácticas para los repositorios en la gestión de contenidos multilingües y en lengua no inglesa

Shearer, Kathleen. «Multilingual and Non-English Content». COAR. Accedido 31 de octubre de 2023. https://www.coar-repositories.org/news-updates/what-we-do/multilingual-and-non-english-content/.

El multilingüismo es fundamental para que el panorama de las comunicaciones de investigación sea sano, integrador y diverso. Tras décadas de políticas que han orientado a los investigadores a publicar en inglés, estamos empezando a ver una inversión de esta tendencia. La Recomendación de la UNESCO sobre la Ciencia Abierta, por ejemplo, pide a los Estados miembros que fomenten «el multilingüismo en la práctica de la ciencia, en las publicaciones científicas y en las comunicaciones académicas». En China, Europa y otras jurisdicciones, los responsables políticos están introduciendo nuevas medidas que animan a los investigadores a publicar en las lenguas locales.

En agosto de 2022, el COAR puso en marcha el Grupo de Trabajo COAR sobre Apoyo al Multilingüismo y a los Contenidos en Lengua No Inglesa en los Repositorios para desarrollar y promover buenas prácticas para los repositorios en la gestión de contenidos multilingües y en lengua no inglesa. Basándose en 17 casos de uso aportados por diferentes comunidades de interesados (gestores y usuarios de repositorios, autores y traductores, agregadores y sistemas de localización), el Grupo de Trabajo identificó tres áreas relevantes para su labor:

  • Mejora de la visibilidad de los contenidos en lengua no inglesa.
  • Conservación de contenidos multilingües en un repositorio
  • Apoyo a las traducciones


En junio de 2023, el Grupo de Trabajo publicó un primer borrador de recomendaciones para su revisión por parte de la comunidad. La consulta dio lugar a una amplia gama de aportaciones, que fueron revisadas por el Grupo de Trabajo e incorporadas al documento de recomendaciones. Este documento presenta las recomendaciones actualizadas basadas en las aportaciones de la comunidad. Las recomendaciones identifican buenas prácticas para los gestores de repositorios y los desarrolladores de software para repositorios, y se centran en los temas de metadatos, palabras clave multilingües, interfaces de usuario, formatos y licencias que mejorarán la visibilidad, el descubrimiento y la reutilización del contenido de los repositorios en una variedad de idiomas.

Resumen de recomendaciones

Las recomendaciones proporcionadas se refieren a la creación y curación de metadatos para repositorios, y también abordan sugerencias para desarrolladores de software/plataforma de repositorios. Aquí tienes un resumen de los puntos clave:

Creación y Curación de Metadatos:

  1. Declarar el idioma del recurso a nivel del elemento: Especificar claramente el idioma del recurso en los metadatos.
  2. Declarar el idioma de los metadatos (por ejemplo, atributo xml:lang): Indicar el idioma de los metadatos utilizando atributos apropiados.
  3. Utilizar códigos de idioma estándar: Utilizar códigos de idioma estándar de dos o tres letras (ISO 639) para mantener la consistencia.
  4. Habilitar el soporte UTF-8 y utilizar el alfabeto o sistema de escritura original: Asegurarse de que el repositorio admita la codificación UTF-8 y utilizar el sistema de escritura original siempre que sea posible. Si es necesario transliterar los metadatos, seguir estándares reconocidos (por ejemplo, ISO).
  5. Configurar múltiples idiomas de interfaz: Si el software del repositorio lo permite, proporcionar interfaces de usuario en el idioma nativo del público objetivo, además del inglés.
  6. Utilizar sistemas de escritura de los documentos depositados y proporcionar identificadores persistentes para nombres personales: Emplear el sistema de escritura utilizado en los documentos depositados para los nombres personales y ofrecer identificadores persistentes como ORCID para una identificación inequívoca.
  7. Incluir palabras clave en varios idiomas: Utilizar vocabularios y tesauros multilingües para enriquecer los metadatos con palabras clave en varios idiomas.
  8. Recomendaciones para gestores de repositorios sobre contenido traducido: Estas recomendaciones pueden contener orientación sobre cómo gestionar contenido traducido en el repositorio.

Para Desarrolladores de Software/Plataforma de Repositorios:

  1. Uso coherente de códigos de idioma: Asegurarse de que se apliquen de manera consistente los códigos de idioma en las colecciones del repositorio para metadatos estandarizados.
  2. Exponer el idioma de los metadatos a través de protocolos de intercambio: Garantizar que el idioma de los metadatos se exponga a través de protocolos de intercambio de metadatos como OAI-PMH, GraphQL API, etc.
  3. Mejorar el soporte de códigos de idioma ISO: Mejorar el soporte de códigos de idioma ISO, incluyendo códigos de tres letras para idiomas que los requieran.
  4. Exponer identificadores persistentes a través de OAI-PMH: Permitir la exposición de identificadores persistentes (por ejemplo, ORCID) a través de OAI-PMH según las recomendaciones del grupo de trabajo PIDs en Dublin Core™.
  5. Soportar palabras clave multilingües: Mejorar la capacidad de descubrimiento ofreciendo soporte para palabras clave en varios idiomas. Por ejemplo, habilitar la integración en tiempo real con Wikidata para sugerir términos relevantes cuando los usuarios introduzcan metadatos.
  6. Asignación automática de términos controlados: Implementar mecanismos para la asignación automática de términos controlados basados en los metadatos existentes, lo que puede facilitar el proceso de curación.

Estas recomendaciones tienen como objetivo mejorar la calidad y accesibilidad de los metadatos en los repositorios y facilitar la organización y recuperación de contenido multilingüe y estandarizado.

Manuscritos multilingües medievales

Mhaonaigh, Máire Ní, y Michael Clarke, eds. Medieval Multilingual Manuscripts: Case Studies from Ireland to Japan. De Gruyter, 2022.

Texto completo

Los manuscritos medievales que combinan múltiples lenguas, ya sea en fusión o en colisión, proporcionan pruebas tangibles de interacciones lingüísticas y culturales. En este volumen se documentan estos encuentros mediante estudios de casos de toda Europa y Asia, desde Irlanda hasta Japón, y se explora la creatividad del uso de las lenguas medievales en función del contacto y la fluidez interculturales en este período clave de formación de las naciones (siglos IX-XIV de nuestra era).

La Confederación de Repositorios de Acceso Abierto (COAR) anuncia la primera recomendación para apoyar el contenido multilingüe y no inglés en los repositorios

Shearer, Kathleen. «Multilingual and Non-English Content». COAR. Accedido 2 de noviembre de 2022. https://www.coar-repositories.org/news-updates/what-we-do/multilingual-and-non-english-content/.

El 1 de noviembre de 2022, el Grupo de Trabajo COAR publicó su recomendación inicial para mejorar el descubrimiento de contenidos de los repositorios en una variedad de idiomas, junto con una guía de implementación para la comunidad de repositorios.

El multilingüismo es una característica fundamental de un panorama de comunicaciones de investigación saludable, inclusivo y diverso. Publicar en una lengua local garantiza que el público de diferentes países tenga acceso a la investigación que financian, y también nivela el terreno de juego para los investigadores que hablan diferentes lenguas. La Iniciativa de Helsinki sobre el Multilingüismo en la Comunicación Académica afirma que la descalificación de las lenguas locales o nacionales en la publicación académica es el factor más importante -y a menudo olvidado- que impide a las sociedades utilizar y aprovechar la investigación realizada en el lugar donde viven.

El multilingüismo supone un reto especial para el descubrimiento de los resultados de la investigación. Aunque los investigadores y otros buscadores de información sólo puedan leer en una o dos lenguas, quieren conocer toda la investigación relevante en su área, independientemente de la lengua en la que esté publicada. Sin embargo, los sistemas de búsqueda como Google Scholar y otros índices académicos tienden a proporcionar acceso sólo al contenido disponible en la lengua del usuario. Además, el idioma de un recurso académico a menudo no está etiquetado adecuadamente, lo que significa que una gran parte de los recursos no ingleses quedan excluidos de los resultados de la búsqueda. Por otra parte, muchas infraestructuras de comunicación académica no son óptimas en su apoyo a una variedad de idiomas, ya que se prestó poca atención a esta cuestión durante su proceso de diseño.

En agosto de 2022, el COAR puso en marcha el Grupo de Trabajo del COAR sobre el apoyo al multilingüismo y a los contenidos no ingleses en los repositorios para desarrollar y promover buenas prácticas para los repositorios en la gestión de contenidos multilingües y no ingleses. El grupo de trabajo se centra en la identificación de buenas prácticas para los metadatos, las palabras clave multilingües, las interfaces de usuario, las traducciones, los formatos, las licencias y la indexación que mejorarán la visibilidad del contenido multilingüe y no inglés en todo el mundo. Algunos de los casos de uso que están impulsando las prácticas recomendadas son los siguientes.

  • Quiero encontrar todos los artículos que sean relevantes para mi interés, independientemente del idioma en el que estén publicados
  • Quiero saber si existe una traducción de un artículo o si este documento es una traducción de otro documento
  • Quiero saber cuál es la mejor manera de etiquetar los artículos, tesis o disertaciones que están escritos en más de un idioma para que los lectores sean conscientes de las distintas lenguas
  • Quiero ofrecer metadatos tanto en mi idioma local como en inglés para que el contenido forme parte del registro académico internacional y sea visible para todos
  • Quiero exponer el idioma del artículo en OAI-PMH
  • Quiero saber cuál es el idioma del documento de texto completo que estoy indexando, para poder ayudar a los usuarios a encontrar el contenido en su idioma preferido

Recomendación 1 (Ver)

Todos los registros del repositorio deberían incluir una etiqueta en el campo de metadatos de idioma que identifique el idioma del recurso, y una etiqueta que identifique el idioma de los metadatos (incluso si los recursos están en inglés).

¿Por qué? Se trata de una recomendación muy sencilla, pero extremadamente poderosa. Cuando la lengua de los metadatos y la del recurso se atribuyen correctamente, los servicios de localización e indexación pueden procesar y analizar el texto de forma adecuada. La indexación implica prácticas de análisis de texto como la separación de palabras, la lematización (agrupación de las formas flexionadas de una palabra para que puedan analizarse como un solo elemento) y el tratamiento adecuado de las palabras de parada, todas ellas específicas de cada idioma. La inclusión de la etiqueta lingüística permite a los buscadores de información, agregadores y otros servicios de búsqueda identificar correctamente el idioma de los metadatos y del texto completo y tratar los elementos en consecuencia.

En los próximos meses se publicarán otras recomendaciones que abordan los diferentes casos de uso.

Publicar en inglés o perecer : debate de la comunidad DORA sobre el multilingüismo en la comunicación académica

When more is more: A DORA Community Discussion on Multilingualism in Scholarly Communication. JANUARY 20, 2021

Ver completo

La globalización de la investigación ha provocado el aumento simultáneo del inglés como lengua reconocida de los estudios y el declive de las lenguas nacionales y locales en la comunicación académica. Sin embargo, la difusión de la investigación en diversas lenguas permite que los resultados de la investigación geográfica y culturalmente relevantes sean accesibles a los actores regionales, creando impacto y fomentando las interacciones entre la ciencia y la sociedad. En los últimos años, los sistemas de evaluación de la investigación, a menudo basados en índices bibliométricos globales, han evolucionado para favorecer los resultados en la lengua franca moderna, el inglés. Tener una lengua franca ha beneficiado al mundo académico: ha permitido la colaboración, el intercambio de conocimientos y el debate internacional entre culturas. Sin embargo, la exigencia de comunicarse en inglés también se considera una forma de marginación, y no se ajusta a todos los propósitos de la erudición (como informar al público y a los responsables de la toma de decisiones en todos los países, no sólo en los anglófonos). En los últimos años, la comunidad investigadora mundial ha empezado a cuestionar la solidez de un sistema que prefiere una lengua sobre otras. Esto ha dado lugar a numerosos llamamientos a la acción, como la Iniciativa de Helsinki, que llama la atención sobre la importancia del multilingüismo y la «bibliodiversidad» en la investigación.

La comunidad investigadora internacional tiene una clara necesidad de resolver los problemas que plantea el sistema actual, que favorece la investigación en inglés. DORA pretende ayudar a la comunidad investigadora internacional a mejorar la evaluación de la investigación en todas las disciplinas académicas. Sin duda, los procesos de evaluación y recompensa influyen en las decisiones de los académicos sobre cómo, dónde y en qué idiomas publican. Los estudios indican que los trabajos publicados en idiomas distintos del inglés tienden a recibir menos citas que las publicaciones en inglés. Si los académicos optan por publicar en inglés en lugar de en otros idiomas porque creen que sus carreras dependen de ello, tanto el mundo académico como la sociedad pueden verse perjudicados. En un mundo ideal, los investigadores se sentirían libres de comunicar sus hallazgos al público al que se dirigen en la lengua que mejor se adapte a este propósito. Un sistema de evaluación de la investigación óptimamente diseñado reconocería la importancia de la diversidad lingüística en la comunicación académica, permitir a los académicos publicar en sus lenguas maternas, recompensar a los académicos por su trabajo en todas las lenguas y liberar a los investigadores de la presión de «publicar en inglés o perecer».

Para promover el debate sobre estos retos, DORA organizó el 13 de agosto de 2020 un seminario web sobre el «Reconocimiento de los productos académicos multilingües en la evaluación académica». En este seminario web, un panel de expertos exploró la importancia de las publicaciones en lengua local, los problemas causados por favorecer las publicaciones en inglés y los beneficios de valorar todos los trabajos académicos en los procedimientos de evaluación.