Archivo de la etiqueta: Suecia

La Biblioteca Nacional de Suecia recurre a la Inteligencia Artificial para analizar siglos de datos

Salian, Isha. «Sweden’s National Library Turns Page to AI». NVIDIA Blog, 23 de enero de 2023.

Ver completo

La biblioteca está entrenando modelos de IA de última generación en medio milenio de textos suecos para apoyar la investigación en humanidades, historia, lingüística, medios de comunicación y otros campos.

Durante los últimos 500 años, la Biblioteca Nacional de Suecia ha recopilado prácticamente todas las palabras publicadas en sueco, desde manuscritos medievales de incalculable valor hasta menús de pizza actuales.

Gracias a una ley centenaria que obliga a entregar a la biblioteca un ejemplar de todo lo publicado en sueco -también conocida como Kungliga biblioteket, o KB-, sus colecciones abarcan desde lo más obvio a lo más oscuro: libros, periódicos, emisiones de radio y televisión, contenidos de Internet, tesis doctorales, postales, menús y videojuegos. Se trata de una colección muy diversa de casi 26 petabytes de datos, ideal para entrenar la IA más avanzada. «Podemos crear modelos de IA de última generación para la lengua sueca porque tenemos los mejores datos», afirma Love Börjeson, directora de KBLab, el laboratorio de datos de la biblioteca.

Utilizando NVIDIA DGX systems, el grupo ha desarrollado más de dos docenas de modelos de transformadores de código abierto, disponibles en Hugging Face. Los modelos, descargados por hasta 200.000 desarrolladores al mes, permiten la investigación en la biblioteca y otras instituciones académicas.

«Antes de que se creara nuestro laboratorio, los investigadores no podían acceder a un conjunto de datos en la biblioteca, sino que tenían que mirar un solo objeto digital cada vez», explica Börjeson. «Era necesario que la biblioteca creara conjuntos de datos que permitieran a los investigadores realizar investigaciones orientadas a la cantidad».

De este modo, los investigadores pronto podrán crear conjuntos de datos hiperespecializados, por ejemplo, para buscar todas las postales suecas que representen una iglesia, todos los textos escritos en un estilo concreto o todas las menciones de un personaje histórico en libros, artículos de prensa y programas de televisión.

Los conjuntos de datos de la biblioteca representan toda la diversidad de la lengua sueca, incluidas sus variaciones formales e informales, los dialectos regionales y los cambios a lo largo del tiempo. «Nuestro flujo de entrada es continuo y creciente: cada mes recibimos más de 50 terabytes de datos nuevos», explica Börjeson.

Además de los modelos de transformación que comprenden el texto sueco, KBLab cuenta con una herramienta de IA que transcribe sonido a texto, lo que permite a la biblioteca transcribir su vasta colección de emisiones de radio para que los investigadores puedan buscar contenidos específicos en los registros de audio.

KBLab también está empezando a desarrollar modelos de texto generativo y trabaja en un modelo de IA que podría procesar vídeos y crear descripciones automáticas de su contenido.

«También queremos vincular todas las modalidades», afirma Börjeson. «Cuando se busque un término concreto en las bases de datos de la biblioteca, deberíamos ser capaces de devolver resultados que incluyan texto, audio y vídeo».

KBLab se ha asociado con investigadores de la Universidad de Gotemburgo, que están desarrollando aplicaciones que utilizan los modelos del laboratorio para realizar investigaciones lingüísticas, incluido un proyecto de apoyo a la labor de la Academia Sueca para modernizar sus técnicas basadas en datos para crear diccionarios suecos.

Springer Nature formaliza nuevos acuerdos transformadores hacia el Acceso Abierto con consorcios de bibliotecas universitarias de Suecia y Noruega

b5aw6zsmohphevqdtplk

 

Springer Nature accelerates its transformative journey with the signing of landmark pure Open Access (OA) deal.

Ver original

 

Los nuevos acuerdos formalizados esta semana con el consorcio Bibsam en Suecia y el consorcio Unit de Noruega elevan a diez el número de acuerdos leídos y publicados por Springer Nature, lo que sitúa al editor en el camino de convertirse en un editor transformador.

 

Suecia

En una primicia para Springer Nature, Bibsam, que representa a las bibliotecas institucionales, y cuatro de los organismos de financiación de Suecia (Swedish Research Council, Formas, Forte y Vinnova) han llegado a un acuerdo que les permitirá compartir los costes de publicación en las revistas de la OA de Springer Nature. Esto permitirá a los investigadores suecos afiliados a las organizaciones participantes en el consorcio Bibsam publicar en más de 570 revistas de OA de Springer Nature, incluyendo Nature Communications, la revista de OA más citada del mundo, y Scientific Reports, una de las revistas de OA más importantes del mundo, sin tener que pagar directamente los costes de Cargos por Procesamiento de Articulos (APCs)

Según el consorcio Bibsam, este enfoque de colaboración para apoyar a OA es sólo el comienzo y continuan trabajando con los financiadores y editores para encontrar soluciones para nuevos acuerdos de publicación. Este histórico acuerdo con Bibsam, que también renueva su relación con Springer Nature, cubrirá el 99% de la producción editorial sueca.

Noruega

Springer Nature también ha formalizado un acuerdo de lectura y publicación transformadora con Noruega. Este acuerdo, que se extenderá de 2020 a 2022, permitirán a los investigadores noruegos leer artículos en revistas sobre SpringerLink y a los autores noruegos publicar Open Access en más de 2.000 revistas, haciendo que la investigación primaria con los autores noruegos correspondientes sea accesible de forma inmediata y gratuita desde el punto de publicación, que según la Unidad, «cumplirá con todos nuestros requisitos para los acuerdos de transición y permitirá a los investigadores noruegos leer y publicar en la mayoría de las revistas Springer».

Comentando sobre estos dos acuerdos, Frank Vrancken Peeters, Director Comercial de Springer Nature, dijo: «Springer Nature se ha comprometido a acelerar la transición hacia el acceso abierto, ya que el acceso rápido y temprano a los resultados de la investigación es fundamental para el avance de la ciencia y el descubrimiento».

 

 

Norse World: nueva base de datos de acceso abierto para la literatura medieval

 

c_753278-l_1-k_imagepuff

Norse World

http://www.uu.se/norseworld

 

Norse World es una nueva base de datos que facilitará a los investigadores el estudio de las percepciones del mundo circundante en la literatura escandinava medieval. La nueva herramienta es un recurso digital gratuito para todos dirigido a investigadores del campos de la historia, la filología,  la lengua, la literatura comparada, los estudios de manuscritos y las humanidades digitales.

 

Las humanidades espaciales y la cartografía cognitiva son campos en crecimiento dentro de las humanidades digitales, pero el estudio del pensamiento espacial en la Escandinavia medieval y su desarrollo como área de investigación se ven obstaculizados por la falta de información sobre topónimos y otras referencias espaciales en los textos literarios.

La literatura medieval escandinava es una mina de información sobre cómo se visualizaban las tierras extranjeras en la Edad Media: ¿Sobre qué lugares se escribieron y dónde? ¿Cómo se vinculan los topónimos con los diferentes textos? ¿Existe un concepto compartido de espacialidad? ¿Cómo se relaciona el espacio con el género?

La nueva herramienta consta de tres componentes principales: una base de datos MySQL a medida, Norse World, un mapa interactivo, y una aplicación independiente que permite el acceso a la base de datos cuando los usuarios buscan el recurso cartográfico. Los tres componentes utilizan código abierto, lo que permite su integración en grandes clusters de infraestructuras. La herramienta es una primicia científica y técnica sin equivalente en lo que se ha hecho anteriormente en filología y lingüística.

El recurso digital Norse World es el resultado del proyecto de infraestructura The Norse perception of the world / Fornnordisk omvärldsuppfattning (IN16-0093:1) financiado por el Riksbankens Jubileumsfond (2017-2020).

 

Estudios de Morfología y Sintaxis Övdalianas: Nuevas investigaciones sobre una lengua escandinava menos conocida

la_221_hb

Kristine, B., R. Henrik, et al. (2015). [e-Book]  Studies in Övdalian Morphology and Syntax: New research on a lesser-known Scandinavian language. Texto completo: http://www.jbe-platform.com/content/books/9789027269133

 

Övdalian is spoken in central Sweden by about 2000 speakers. Traditionally categorized as a dialect of Swedish, it has not received much international attention. However, Övdalian is typologically closer to Faroese or Icelandic than it is to Swedish, and since it has been spoken in relative isolation for about 1000 years, a number of interesting linguistic archaisms have been preserved and innovations have developed. This volume provides seven papers about Övdalian morphology and syntax. The papers, all based on extensive fieldwork, cover topics such as verb movement, subject doubling, wh-words and case in Övdalian. Constituting the first comprehensive linguistic description of Övdalian in English, this volume is of interest for linguists in the fields of Scandinavian and Germanic linguistics, and also historical linguists will be thrilled by some of the presented data. The data and the analyses presented here furthermore challenge our view of the morphosyntax of the Scandinavian languages in some cases – as could be expected when a new language enters the linguistic arena.