Archivo de la etiqueta: Catalogación

Bibliotecarios contra las máquinas: ¿Es ChatGPT la encarnación de EMERAC?

Press, Gil. «Librarians Against The Machines: Is ChatGPT The Incarnation Of EMERAC?» Forbes. Accedido 28 de marzo de 2024. https://www.forbes.com/sites/gilpress/2023/04/30/librarians-against-the-machines-is-chatgpt-the-incarnation-of-emerac/.

A través de los años, la automatización ha transformado las bibliotecas, pero también ha abierto nuevas posibilidades de organización y acceso a la información. El surgimiento de ChatGPT y otros Modelos de Lenguaje Grandes (LLM) plantea preguntas sobre el papel futuro de la inteligencia artificial en la búsqueda y comprensión del conocimiento humano, como se ve en un estudio reciente que compara las respuestas de ChatGPT con las de los médicos.

«No pueden construir una máquina para hacer nuestro trabajo; hay demasiadas referencias cruzadas en este lugar», dice la bibliotecaria jefe (Katharine Hepburn) a sus ansiosos colegas del departamento de investigación cuando se contrata a un «ingeniero de métodos» (Spencer Tracy) para «mejorar la relación hombre-hora» en una gran empresa. Al final de la película «Su otra esposa» (Desk Set) (lanzada el 1 de mayo de 1957), demuestra su valía al ganarse, no sólo el corazón del ingeniero, sino también un concurso contra EMERAC, un «cerebro electrónico» del tamaño de una habitación, de aspecto siniestro.

Unos años antes de que los primeros «cerebros electrónicos» empezaran a automatizar el trabajo, Fremont Rider, bibliotecario de la Universidad de Wesleyan, publicó The Scholar and the Future of the Research Library (1944). Calculaba que el tamaño de las bibliotecas universitarias estadounidenses se duplicaba cada dieciséis años. Dado este ritmo de crecimiento, Rider especulaba con que la Biblioteca de Yale en 2040 tendría «aproximadamente 200.000.000 de volúmenes, que ocuparían más de 6.000 millas de estanterías… [requiriendo] una plantilla de catalogación de más de seis mil personas».

Algo parecido a lo que se predijo en los años 30, cuando las centralitas telefónicas automáticas sustituyeron a las centralitas asistidas por operadoras, que en poco tiempo se necesitarían más operadoras que chicas jóvenes aptas para el trabajo.

Esa «predicción» sirvió para justificar la automatización, ya que AT&T tuvo que explicar a sus clientes por qué tenían que hacer el trabajo que antes realizaba otro ser humano. La predicción de Rider sobre las bibliotecas y los bibliotecarios era correcta en cuanto al aumento del volumen de conocimientos almacenados en papel, pero no preveía que los «cerebros electrónicos» automatizarían parte del trabajo del conocimiento y proporcionarían almacenamiento digital para el creciente volumen de información. Y lo que es más importante, proporcionarán mejores medios para encontrar la información pertinente.

El afán por proporcionar a los buscadores de conocimiento el saber que buscan es mucho más antiguo que Google. En 1728, Ephraim Chambers, un fabricante de globos terráqueos londinense, publicó la Cyclopaedia, or, An Universal Dictionary of Arts and Sciences. Fue probablemente el primer intento de relacionar por asociación todos los artículos de una enciclopedia o, más en general, todos los componentes del conocimiento humano. En el prefacio, Chambers explica su innovador sistema de referencias cruzadas:

«Los antiguos lexicógrafos no han intentado nada parecido a una estructura en sus obras; ni parecen haber sido conscientes de que un diccionario era en cierta medida capaz de las ventajas de un discurso continuado. En consecuencia, no vemos nada parecido a un Todo en lo que han hecho …. Nos esforzamos por conseguirlo, considerando las diversas Materias [es decir, temas] no sólo de forma absoluta e independiente, en cuanto a lo que son en sí mismas, sino también de forma relativa, o como se relacionan entre sí. Ambas son tratadas como tantos Todoes, y tantas Partes de un Todo mayor; su Conexión con el cual, es señalada por una Referencia… Se abre una Comunicación entre las varias partes de la Obra; y los varios Artículos son en cierta medida reemplazados en su Orden natural de Ciencia, del cual el Técnico o Alfabético los había removido.»

Y justo antes de la llegada de los «cerebros electrónicos», Vannevar Bush escribió en As We May Think (1945): «Nuestra ineptitud para llegar a los registros se debe en gran medida a la artificialidad de los sistemas de indexación… La selección [es decir, la recuperación de información] por asociación, más que por indexación, aún puede mecanizarse».

¿Nos proporcionarán los «cerebros electrónicos» la recuperación de información por asociación? ¿Ayudarán a los bibliotecarios o servirán para sustituirlos?

En la década de 1960, la «amenaza» que suponían los ordenadores y la automatización para las bibliotecas se convirtió en una de las principales preocupaciones de los bibliotecarios. Paul Wasserman abría The Librarian and the Machine (1965) con la siguiente declaración: «Como si no fuera ya un problema suficiente para los administradores de bibliotecas que se esfuerzan por responder a las innumerables presiones e infinitas complejidades…. Un terror más nuevo e incluso más premonitorio [cursiva mía] … empezaba a emerger con mayor claridad. Me refiero al ordenador y al aparato de apoyo que lo acompaña».

Pero, al igual que Desk Set, su conclusión al final de su estudio de un año de duración es reconfortante: «Las máquinas pueden hacer hoy gran parte del trabajo del hombre con mayor rapidez y eficacia; pero no pueden hacer tan bien su trabajo intelectual».

¿Por qué era -y sigue siendo- siquiera concebible que un ordenador pueda hacer el trabajo del hombre, o más estrechamente, sustituir a un bibliotecario? ¿Porque la mayoría de nosotros suscribe fervientemente la alucinación de la «inteligencia general artificial» (AGI)? ¿Por nuestra «fascinación morbosa por la última forma de tecnología», por utilizar otra declaración de Wasserman en 1965?

En la película «Su otra esposa», en particular la afirmación sobre las referencias cruzadas, ha servido de fuente de inspiración y de grito de guerra para los bibliotecarios en sus encuentros con la creciente automatización y digitalización. Lo conocí cuando me incorporé en 1988 al departamento de investigación corporativa, parte de una magnífica red mundial de bibliotecas, de uno de los principales proveedores de «cerebros electrónicos», Digital Equipment Corporation (DEC).

El grupo para el que trabajaba no sólo contaba con bibliotecarios y muchos conocimientos en papel, sino también con información digitalizada y un equipo de expertos en recuperación de información (lo que diez años después empezamos a llamar «búsqueda»). Gestionaban una base de datos de artículos nuevos digitalizados («sistema de información competitiva» o SIC) y desarrollaron un software de búsqueda en bases de datos -lo que hoy llamamos «IA»- que podía distinguir entre «DEC» como nombre de la empresa y «Dec» como abreviatura de diciembre.

Tim Berners-Lee, preocupado como Bush y Chambers antes que él por la forma en que se organizaba la información, dejó obsoletos este tipo de primeros sistemas de búsqueda. Le entusiasmaba la idea de escapar de la «camisa de fuerza de los sistemas de documentación jerárquicos», escribió Berners-Lee en Weaving the Web: «Al poder referenciar todo con la misma facilidad, la web también podía representar asociaciones entre cosas que podían parecer no relacionadas pero que, por alguna razón, en realidad compartían una relación».

Con este salto imaginativo, Berners-Lee superó un escollo importante para todos los sistemas de recuperación de información anteriores: El sistema de clasificación predefinido en su núcleo. Esta idea era tan contraintuitiva que incluso durante los primeros años de la Web se intentó hacer precisamente eso: Clasificar (y organizar en taxonomías predefinidas) toda la información de la Web.

Google triunfó sobre Yahoo! y otros obsesionados con la taxonomía porque entendió el verdadero espíritu de la web. Los fundadores de Google fueron los primeros en aprovechar la perspicacia de Berners-Lee y construir su negocio de recuperación de información siguiendo de cerca las referencias cruzadas (es decir, los enlaces entre páginas) a medida que ocurrían, y correlacionar la relevancia con la cantidad de referencias cruzadas (es decir, la popularidad de las páginas según la cantidad de otras páginas que enlazaban con ellas).

La automatización, que reemplaza a los bibliotecarios y sus catálogos en fichas, ha sido el corazón del éxito de Google y su obsesión con la «escala», a medida que cada vez más conocimiento previamente basado en papel se digitalizaba y cada vez más información nacía digital.

Pero esta automatización también ha llevado a la ampliación, a apoyar nuestro pensamiento creando una nueva forma de organizar la información del mundo, una que esté más en línea con nuestro proceso de pensamiento y más en línea con el volumen actual de información (valiosa e inútil) que es imposible de catalogar.

Chambers escribió sobre «los beneficios de un discurso continuado». Se refería a la «conversación» entre diferentes conceptos y temas, cómo se relacionan entre sí. ¿Presentan ChatGPT y otros Modelos de Lenguaje Grandes (LLM) una nueva realidad en la que las computadoras y sus sistemas de búsqueda de información conversan con sus usuarios y los incitan a formular consultas más precisas? ¿Y cuánto del «trabajo intelectual» del hombre (y con qué calidad) podrá hacer la inteligencia artificial (IA)?

Aquí hay un ejemplo reciente para considerar, sobre las conversaciones entre pacientes y sus médicos. Un nuevo estudio comparó la calidad y empatía de las respuestas a preguntas de pacientes para médicos vs ChatGPT. «Los resultados para la calidad y empatía de las respuestas de ChatGPT fueron bastante sorprendentes», escribe Eric Topol. En cuanto a la calidad, los evaluadores (ciegos a la fuente) prefirieron la respuesta de ChatGPT el 79% del tiempo. La proporción de respuestas empáticas o muy empáticas fue del 45.1% para el chatbot frente al 4.6% para los médicos.

Topol concluye que los resultados «reflejan nuevas posibilidades emocionantes tanto para médicos como para pacientes que no habíamos visto antes en la historia de la atención médica. Todo está bajo el título general de usar máquinas para hacer que los humanos sean más humanos».

Dudo que las máquinas puedan hacer que los humanos sean más humanos. Pero pueden mejorar todos los tipos de trabajo de conocimiento y pueden mejorar drásticamente nuestras conversaciones con los trabajadores del conocimiento.

¿Puede la Inteligencia artificial sustituir a los catalogadores humanos?


La catalogación bibliográfica con inteligencia artificial (IA) mejora y automatiza el proceso de descripción de recursos bibliográficos mediante técnicas como procesamiento del lenguaje natural, clasificación automática y extracción de metadatos. Proyectos como BIBFRAME de la Biblioteca del Congreso de EE. UU., junto con iniciativas de Linked Data, exploran el potencial de la IA para integrar y enriquecer datos bibliográficos en la web semántica.

La catalogación bibliográfica con inteligencia artificial (IA) se refiere al uso de técnicas y algoritmos de IA para mejorar y automatizar el proceso de catalogación de recursos bibliográficos, como libros, artículos, documentos y otros medios de información. Hoy por hoy es posible pedir a ChatGPT que nos elabore una referencia bibliográfica en el formato que deseemos con solo poner la URL del recurso, pero ¿Es posible catalogar un libro con inteligencia artificial?

Estas son algunas formas en que la IA puede contribuir a la catalogación bibliográfica:

  1. Procesamiento del lenguaje natural (PLN): La IA puede analizar el contenido de los documentos utilizando técnicas de PLN para extraer información relevante, como temas, conceptos y términos clave.
  2. Clasificación automática: Los algoritmos de aprendizaje automático pueden clasificar automáticamente los documentos en categorías específicas basadas en su contenido, lo que facilita la organización y recuperación de la información.
  3. Extracción de metadatos: La IA puede identificar y extraer metadatos importantes de los documentos, como el título, autor, fecha de publicación, resumen, palabras clave, etc., lo que facilita la creación de registros bibliográficos completos y precisos.
  4. Normalización y enriquecimiento de datos: Los algoritmos de IA pueden normalizar los datos bibliográficos y enriquecerlos con información adicional, como enlaces a bases de datos externas, imágenes de portadas, reseñas de usuarios, etc.
  5. Asistencia en la asignación de materias: La IA puede ayudar en la asignación de términos de materias o encabezamientos de materias a los documentos, lo que mejora la precisión y coherencia de la catalogación temática.
  6. Detección de duplicados: Los algoritmos de IA pueden identificar duplicados y variantes de registros bibliográficos, lo que ayuda a mantener una base de datos bibliográfica limpia y libre de redundancias.

En todo el mundo, hay varios proyectos que están explorando el uso de inteligencia artificial en la catalogación bibliográfica y la gestión de información. Uno de estos proyectos es el Proyecto BIBFRAME, liderado por la Biblioteca del Congreso de los Estados Unidos. BIBFRAME (Bibliographic Framework Initiative) se centra en el desarrollo de un modelo de datos diseñado para reemplazar el formato MARC tradicional. Este modelo busca ser más compatible con la web semántica y permitir la integración de datos bibliográficos con otros recursos en línea. Dentro del proyecto BIBFRAME, se están realizando investigaciones sobre el uso de inteligencia artificial para mejorar la descripción y catalogación de recursos, lo que promete una gestión más eficiente y precisa de la información bibliográfica.

Además, existen proyectos de Linked Data en diversos lugares del mundo que están explorando el potencial de esta tecnología para mejorar la catalogación y la recuperación de información. Estos proyectos aprovechan las tecnologías de Linked Data para enriquecer y vincular datos bibliográficos con otros conjuntos de datos en la web. Ejemplos notables incluyen el proyecto Europeana y el Proyecto DBpedia, que están trabajando en la creación de infraestructuras para facilitar el acceso y la interoperabilidad de los datos bibliográficos a nivel mundial.

Asimismo, muchas bibliotecas están implementando sistemas de automatización que utilizan inteligencia artificial para mejorar la eficiencia de la catalogación y la gestión de colecciones. Estos sistemas incluyen herramientas de procesamiento del lenguaje natural para analizar y extraer metadatos de los documentos, así como algoritmos de aprendizaje automático para la clasificación y asignación de términos de sujetos. Esta automatización no solo agiliza el proceso de catalogación, sino que también mejora la calidad y coherencia de los registros bibliográficos, lo que beneficia tanto a los usuarios como a los profesionales de la información. En resumen, estos proyectos representan avances significativos en el uso de la inteligencia artificial para mejorar la gestión y el acceso a la información bibliográfica en todo el mundo.

El artículo «From ChatGPT to CatGPT: The Implications of Artificial Intelligence on Library Cataloging» de Richard Brzustowicz, publicado en «Information Technology and Libraries» en septiembre de 2023, explora el potencial de los modelos de lenguaje como ChatGPT para transformar la catalogación bibliotecaria. El autor demuestra, a través de experimentos con ChatGPT, su capacidad para generar registros MARC precisos utilizando RDA y otros estándares como Dublin Core Metadata Element Set. Si bien estos resultados muestran el potencial de ChatGPT para agilizar el proceso de creación de registros, también plantean cuestiones importantes relacionadas con los derechos de propiedad intelectual y el sesgo.

Aunque, si bien la inteligencia artificial (IA) puede automatizar muchas tareas asociadas con la catalogación bibliográfica, reemplazar completamente al catalogador humano con IA no es una perspectiva realista en el corto plazo. La catalogación bibliográfica requiere de un profundo entendimiento de los principios de la organización de la información, así como de la capacidad para interpretar contextos y comprender la semántica de los documentos. Aunque la IA puede ayudar en tareas específicas como la extracción de metadatos o la asignación de materias todavía hay aspectos del proceso de catalogación que requieren el juicio y la experiencia humanos.

En lugar de sustituir a los catalogadores humanos, la IA puede complementar su trabajo al automatizar tareas rutinarias y repetitivas, permitiéndoles concentrarse en actividades de mayor valor agregado, como la selección de recursos, la gestión de colecciones y la mejora de servicios de información para los usuarios. Por lo tanto, la IA puede ser una herramienta poderosa para mejorar la eficiencia y la precisión de la catalogación bibliográfica, pero no reemplazar completamente el papel del catalogador humano.

Bibliografía:

Tella, Adeyinka, Oluwole Akanmu Odunola, y Lawal W. O. «Cataloguing and Classification in the Era of Artificial Intelligence: Benefits, and Challenges from the Perspective of Cataloguing Librarians in Oyo State, Nigeria». Vjesnik Bibliotekara Hrvatske 66, n.o 1 (16 de mayo de 2023): 159-76. https://hrcak.srce.hr/clanak/448378

Brzustowicz, Richard. «From ChatGPT to CatGPT: The Implications of Artificial Intelligence on Library Cataloging». Information Technology and Libraries 42 (18 de septiembre de 2023). https://doi.org/10.5860/ital.v42i3.16295.

Eito Brun, Ricardo. «Inteligencia artificial, aprendizaje automático y control bibliográfico. Números cortos de la DDC – Hacia una clasificación basada en máquinas | Biblioteca Nacional de España». Accedido 28 de marzo de 2024. https://www.bne.es/es/blog/biblioteconomia/2022/05/23/inteligencia-artificial-aprendizaje-automatico-y-control-bibliografico-numeros-cortos-de-la-ddc-hacia-una-clasificacion-basada-en-maquinas.

«Inteligencia artificial en bibliotecas: oportunidades como usuarios, y posibles contribuciones | Biblioteca Nacional de España». Accedido 28 de marzo de 2024. https://www.bne.es/es/blog/biblioteconomia/2021/07/09/inteligencia-artificial-en-bibliotecas-oportunidades-como-usuarios-y-posibles-contribuciones.

Lowagie, Hannes. «One Automatic Cataloging Flow: Tests and First Results», 25 de julio de 2023. https://repository.ifla.org/handle/123456789/2686.

Miksa, Shawne D. «Cataloging Principles and Objectives: History and Development». Cataloging & Classification Quarterly 59, n.o 2-3 (13 de abril de 2021): 97-128. https://doi.org/10.1080/01639374.2021.1883173.

Mödden, Elisabeth «El impacto de la inteligencia artificial en las Bibliotecas Nacionales. – Asociación ABINIA», 28 de agosto de 2023. https://asociacionabinia.org/el-impacto-de-la-inteligencia-artificial-en-las-bibliotecas-nacionales/.

Retos presentes y futuros sobre la adopción e implementación de RDA en las bibliotecas de América Latina

Martínez Arellano, Filiberto Felipe, y Patricia De la Rosa Valgañón (eds). Retos presentes y futuros sobre la adopción e implementación de RDA en las bibliotecas de América Latina. Universidad Nacional Autónoma de México. Instituto de Investigaciones Bibliotecológicas y de la Información, 2023.

Texto completo

Esta obra presenta los resultados de una reunión académica entre investigadores, profesores y bibliotecólogos vinculados con la teoría y la práctica de la catalogación, los catálogos y los metadatos, en donde se discutió el tema “Retos presentes y futuros sobre la adopción e implementación de RDA en las bibliotecas de América Latina” En la discusión académica, convocada por la Biblioteca Nacional de México (BNM), el Grupo RDA América Latina y el Caribe de ABINIA, el Instituto de Investigaciones Bibliotecológicas y de la Información (IIBI) y la Dirección General de Bibliotecas y Servicios Digitales de Información (DGBSDI) de la Universidad Nacional Autónoma de México (UNAM), se contó con la participación de representantes de estas instituciones, así como de otras instituciones nacionales e internacionales. La obra reúne valiosas contribuciones sobre el proceso de adopción e implementación del estándar de catalogación RDA (Resource Description and Access) en diversas bibliotecas y otras instituciones, así como contribuciones sobre las principales tendencias en la organización de la información y la catalogación: modelo LRM (Library Reference Model), Datos vinculados (Linked Data) y Grafos del conocimiento (Knowledge Graph). La publicación proporciona un mayor conocimiento de los cambios que han sido incorporados en RDA para afrontar de mejor forma su adopción e implementación en las bibliotecas de México y América Latina, así como su enseñanza e investigación

Pautas REBIUN para la implementación de las RDA. Elementos básicos.

«Pautas REBIUN para la implementación de las RDA. Elementos básicos.», Madrid: REBIUN, CRUE-Red de Bibliotecas. 2023.

PDF

Las pautas RDA-REBIUN tienen como objetivo promover y facilitar la implementación de las RDA, proporcionando una herramienta práctica y asequible para la catalogación de registros bibliográficos. Se componen de veintidós elementos RDA, los más básicos, que pueden aplicarse a la descripción de cualquier recurso bibliográfico. Las pautas pueden servir también de guía para la elaboración de políticas de catalogación y perfiles en las instituciones que forman parte de REBIUN.

Catalogación con MARC, RDA y sistemas de clasificación

Hepler, Reed, y David Horalek. Cataloging with MARC, RDA, and Classification Systems. College of Southern Idaho, 2023. https://csi.pressbooks.pub/cataloging/.

EPUB

Digital PDF

Print PDF

Este libro es el producto de un deseo de combinar elementos de los conocimientos más importantes que se encuentran en los libros de texto de alta calidad sobre el tema de la Catalogación. Reed Hepler, el Bibliotecario de Iniciativas Digitales y REA del College of Southern Idaho, utilizó sus conocimientos junto con los de otros bibliotecarios del CSI y los combinó con información encontrada en recursos REA, de Dominio Público y de Acceso Abierto. El resultado es esta publicación sobre los detalles de una catalogación eficaz y precisa.

Inteligencia Artificial, aprendizaje automático y WorldCat: mejora de los registros para catalogación e identificación

Proffitt, Merrilee. «Machine Learning and WorldCat: Improving Records for Cataloging and Discovery Hanging Together». Hanging Together (blog), 14 de agosto de 2023. https://hangingtogether.org/machine-learning-and-worldcat-improving-records-for-cataloging-and-discovery/.

Cualquier sistema que agregue datos de miles de fuentes necesita procesos sofisticados que mitiguen la duplicación* y garanticen que permanezcan los datos correctos. WorldCat es uno de estos sistemas, que recibe miles de registros bibliográficos de bibliotecas de todo el mundo todos los días. Ya sea en forma manual o automatizada, se ha realizado algún tipo de de duplicación en los registros bibliográficos desde principios de la década de 1980. Si bien el personal de OCLC y los trabajadores bibliotecarios de las instituciones que participan en el Member Merge Program realizan diariamente algunas revisiones manuales de datos, la mayoría de los registros de WorldCat dependen de programas automatizados de de duplicación. Los procesos automatizados introducidos en la década de 1990, conocidos como Duplicate Detection and Resolution (DDR) han madurado. Actualmente, se elimina un promedio de 11.000 registros manualmente y 1 millón mediante la automatización por mes. Además, todos los meses fusionamos millones de registros recién ingresados con registros existentes de WorldCat, lo que significa que también trabajamos para mitigar los registros duplicados antes de su creación.

Las reglas e instrucciones de catalogación han evolucionado muchas veces a lo largo de las décadas. Esto significa que las reglas que tratan la duplicación deben evolucionar continuamente para mantenerse al día con lo último y lo mejor. A lo largo de la vida de nuestros procesos de fusión, el personal de OCLC ha revisado cuidadosamente los resultados para mejorar los procesos, especialmente con fusiones inapropiadas o fallidas, y ha actualizado el sistema basado en reglas en consecuencia. Si bien esto funciona bien en muchos casos, los registros duplicados siguen llegando a WorldCat, lo que afecta a los catalogadores, los investigadores y los flujos de trabajo del personal bibliotecario.

Afortunadamente, la tecnología sigue avanzando y podemos incorporar nuevas tecnologías a los procesos automatizados. En los últimos años, el aprendizaje automático (Machine Learning, ML) se ha hecho un hueco en la corriente dominante, después de haber existido durante varias décadas. Una excelente definición de ML es «…algoritmos [que] construyen un modelo basado en datos de muestra, conocidos como datos de entrenamiento, con el fin de hacer predicciones o tomar decisiones sin ser explícitamente programados para ello».

Se investigaron diferentes algoritmos de ML, pero el obstáculo más importante era reunir un conjunto de datos de entrenamiento para ejecutar el algoritmo elegido. El equipo de Ciencia de Datos se puso en contacto con el equipo de Calidad de Datos para encontrar conjuntos de datos. Calidad de Datos pudo proporcionar información para los conjuntos iniciales de revisiones.

A mediados de 2022, se perfeccionó el modelo ML con análisis continuos y aportaciones del equipo de Calidad de Datos. También se construyó y probó una interfaz de usuario para el ejercicio de etiquetado de datos. La interfaz permitía a los usuarios recuperar un par de registros bibliográficos que fueran posibles duplicados. Los usuarios podían generar el par seleccionando valores para la lengua de catalogación, el tipo de material y la antigüedad del registro

En noviembre, se presentó la herramienta a los participantes del Programa de fusión de miembros, que se implementó para todos los miembros de OCLC a principios de diciembre. La herramienta estuvo abierta hasta mediados de abril de 2023. Para entonces, se habían evaluado poco más de 34.000 pares de posibles registros duplicados. Si bien no se realizaron tres revisiones de cada par, se recopilaron muchos datos para entrenar el modelo ML. Descubrimos que más del 95% de los pares que recibieron varias revisiones no presentaban desacuerdos entre los revisores. Esto demostró que el modelo estaba a la par con los humanos en la identificación de duplicados. Estos datos se utilizaron para perfeccionar el modelo, y el equipo de Calidad de Datos revisó los nuevos resultados para comprobar su precisión.

A partir de fines de agosto de 2023, se procesará una serie inicial de un (1) millón de registros -500.000 pares- a través del algoritmo de aprendizaje automático. Como resultado, se fusionarán 500 000 registros duplicados en WorldCat, lo que mejorará y agilizará las experiencias de catalogación, identificación y préstamo interbibliotecario tanto para el personal de la biblioteca como para los usuarios finales.

Manual de catalogación de partituras

Recine, Analúcia dos S. Viviani, y Marina Macambyra. Manual de catalogação de partituras da biblioteca da ECAPortal de Livros Abertos da USP. Portal de Livros Abertos da USP, 2018.

Texto completo

Manual de normas para la catalogación de partituras que explica la recogida de información, normalización y registro en los campos de una base de datos, así como la disposición física, conservación y recuperación de la información.

Buenas prácticas para Catalogación musical Uso con RDA y MARC21

Best Practices for Music Cataloging Using RDA and MARC21. Task Force, Bibliographic Control Committee, Music Library Association, 2014

Texto completo

Estas directrices de buenas prácticas están ordenadas por número de instrucción RDA. Las instrucciones RDA ordenadas según las entidades incorporadas en los recursos, sus atributos y sus relaciones, y no por formato de soporte (como ocurría en AACR2). están estructuradas en consecuencia. Las situaciones relativas a formatos específicos se describen en el contexto de la instrucción RDA aplicable

Manual de catalogación de películas de la biblioteca del TCE

Macambyra, Marina. Manual de catalogação de filmes da biblioteca da ECA. Portal de Livros Abertos da USP. Portal de Livros Abertos da USP, 2016.

Texto completo

Este manual fue elaborado con el objetivo de divulgar al público interesado la experiencia acumulada por la Biblioteca de la Escuela de Comunicación y Artes de la USP (ECA/USP) en el tratamiento de la información en colecciones de imágenes en movimiento. Su origen es el manual interno de la sección responsable por el tratamiento de documentos audiovisuales en la Biblioteca, cuyas soluciones se presentan aquí para que puedan ser comprendidas por cualquier bibliotecario que esté en busca de información sobre el tema. Se han eliminado detalles administrativos que sólo tienen sentido en la institución de origen. Para enriquecer la obra con reflexiones que van más allá de la rutina de trabajo local, se han añadido comparaciones de la metodología ECA con normas internacionales.

Perfil de aplicación de RDA para monografías antiguas

Perfil de aplicación de RDA para monografías antiguas en la Biblioteca Nacional de España. Madrid: Biblioteca Nacional de España, 2023

Texto completo

Más sobre RDA

Recoge las directrices y políticas de la BNE en su adaptación del estándar RDA a la catalogación de monografías antiguas (anteriores a 1831

La Biblioteca Nacional de España publica hoy su perfil de aplicación de RDA para monografías antiguas, las pautas por las que se regirá desde ahora la descripción de los libros antiguos de la institución, sustituyendo a las reglas anteriores.

El perfil de aplicación recoge las directrices y políticas de la BNE en su adaptación del estándar RDA a la catalogación de monografías antiguas (anteriores a 1831). Estas políticas detallan los elementos núcleo, es decir, obligatorios, y orientan en la toma de decisiones en el caso de instrucciones para las que RDA permite diferentes actuaciones, o qué hacer con aquellos otros elementos que RDA califica como opcionales, ya sea por inclusión u omisión. Incorpora además una serie de novedades a la descripción del libro antiguo, destinadas a una mejor identificación y recuperación del mismo.