El uso potencial de modelos de Inteligencia Artificial para generar encabezamientos de materia de la Biblioteca del Congreso (LCSH).


Chow, Eric H. C., T. J. Kao, y Xiaoli Li. «An Experiment with the Use of ChatGPT for LCSH Subject Assignment on Electronic Theses and Dissertations». arXiv, 10 de julio de 2024. https://doi.org/10.48550/arXiv.2403.16424.

Texto completo

Este estudio explora el uso potencial de modelos de lenguaje grande (LLMs) para generar encabezamientos de materia de la Biblioteca del Congreso (LCSH). Los autores emplearon ChatGPT para generar encabezamientos de materia para tesis y disertaciones electrónicas (ETDs) basándose en sus títulos y resúmenes. Los resultados sugieren que LLMs como ChatGPT tienen el potencial de reducir el tiempo de catalogación necesario para asignar términos de materia LCSH a las ETDs, así como mejorar la visibilidad de este tipo de recursos en bibliotecas académicas. Sin embargo, los catalogadores humanos siguen siendo esenciales para verificar y mejorar la validez, exhaustividad y especificidad de los LCSH generados por los LLMs.

En este estudio, los investigadores exploraron el uso de modelos de lenguaje grande (LLM), específicamente ChatGPT, para generar encabezamientos de materia de la Biblioteca del Congreso (LCSH) para tesis y disertaciones electrónicas (ETDs). Los resultados revelaron que, aunque ChatGPT puede acceder a un corpus internalizado de LCSH y registros MARC 21, el modelo tiene dificultades con la validez, especificidad y exhaustividad en los encabezamientos de materia generados. Además, aunque algunos problemas de validez pueden mitigarse con herramientas complementarias, el modelo aún falla en términos de especificidad y exhaustividad, especialmente con las cadenas LCSH que implican subdivisiones, fallando en producir resultados precisos aproximadamente la mitad del tiempo.

Estos resultados sugieren que, para asegurar la precisión y fiabilidad del proceso de catalogación, la participación de catalogadores humanos sigue siendo esencial. No obstante, el uso de LLMs como ChatGPT en la catalogación de ETDs o materiales similares, cuyos títulos y resúmenes son altamente indicativos de sus temas, aún puede desempeñar un papel importante de apoyo. Actualmente, muchas bibliotecas académicas están abrumadas por una afluencia de nuevos recursos electrónicos, incluidos ETDs, que superan con creces la capacidad de los catalogadores humanos para procesarlos de manera oportuna. El estudio sugiere que los LLMs podrían utilizarse como una herramienta económica para la generación inmediata de LCSH, dado que el costo asociado con el uso de la API OpenAI de Microsoft en el presente estudio ascendió a aproximadamente USD $0.25 y el tiempo total utilizado para procesar los 30 ETDs fue de aproximadamente 3 minutos.

Como herramienta de filtrado inicial y sugerencia, ChatGPT permite a los catalogadores experimentados centrarse en mejorar la precisión y completitud de los registros de catálogo. Este enfoque complementario puede potencialmente aumentar la productividad al aprovechar los LLMs para tareas básicas, mientras se preserva la experiencia crítica e insustituible de los catalogadores humanos. Además, para los catalogadores principiantes, refinar una sugerencia de LCSH existente, aunque imperfecta, de ChatGPT es menos intimidante que construir nuevos encabezamientos de materia desde cero. Por lo tanto, el uso de LLMs tiene el potencial de reducir el tiempo de catalogación necesario para asignar términos de materia LCSH para ETDs. Además, para los encabezamientos de materia generados por LLM que no son válidos como LCSH, pero que pueden ser suficientemente descriptivos para describir, los catalogadores podrían incluso considerar insertar estos términos directamente en el campo 653 (término de índice no controlado) en un registro MARC para mejorar la capacidad de descubrimiento del trabajo en un catálogo de biblioteca

2 comentarios en “El uso potencial de modelos de Inteligencia Artificial para generar encabezamientos de materia de la Biblioteca del Congreso (LCSH).

  1. Pingback: Cómo la Inteligencia Artificial generativa está transformando el papel de los profesionales de la información | Universo Abierto

  2. Pingback: Cómo la Inteligencia Artificial generativa está transformando el papel de los profesionales de la información | Boletín DIB: De interés para la biblioteca

Los comentarios están cerrados.