Elsevier OA CC-BY Corpus: 40.000 artículos abiertos y sus metadatos

how-parse-trees-work

Elsevier OA CC-BY Corpus.

Este es el primer corpus abierto de artículos de investigación científica que tiene una muestra representativa de todas las disciplinas científicas. Este corpus no solo incluye el texto completo del artículo, sino también los metadatos de los documentos, junto con la información bibliográfica de cada referencia.

Este conjunto de datos se publicó para respaldar el desarrollo de modelos de aprendizaje automático (ML) y procesamiento del lenguaje natural (NLP) dirigidos a artículos científicos de todos los dominios de investigación. Si bien la versión se basa en otros conjuntos de datos diseñados para dominios y tareas específicos, permitirá derivar conjuntos de datos similares o desarrollar modelos que se puedan aplicar y probar en todos los dominios.

	Dos pasitos pa’trás,… en ¿Qué es la Enshittification de…
	Los peligros de pedi… en Los peligros de pedir consejo…
	Cuando la IA cruza l… en Confianza, actitudes y uso de…
	Fernanda Guadalupe en Declaración de San Francisco s…
	La habilidad humana… en La habilidad humana que la IA…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca

Elsevier OA CC-BY Corpus: 40.000 artículos abiertos y sus metadatos

Comparte esto: