
OCLC. «Implementing AI to Further Scale and Accelerate WorldCat De-Duplication.» Última modificación 4 de febrero de 2025. https://www.oclc.org/en/news/announcements/2025/ai-worldcat-deduplication.html.
OCLC ha implementado un modelo de aprendizaje automático para la detección y eliminación de duplicados en los registros bibliográficos de WorldCat, como parte de sus esfuerzos continuos para mejorar la calidad de los datos y la experiencia de búsqueda para los usuarios de la red global de bibliotecas. La iniciativa comenzó en agosto de 2023, cuando se introdujo el primer modelo de aprendizaje automático para identificar duplicados de libros impresos en inglés, con el apoyo de la comunidad de catalogadores, quienes participaron en ejercicios de etiquetado de datos. Este proceso resultó en la eliminación de alrededor de 5,4 millones de registros duplicados de libros impresos en varios idiomas como inglés, francés, alemán, italiano y español.
El modelo de inteligencia artificial de OCLC se ha optimizado y extendido para abarcar todos los formatos, lenguajes y escrituras de WorldCat, utilizando los datos etiquetados por la comunidad para entrenar y ajustar el algoritmo. Tras una extensa fase de pruebas internas y la colaboración de bibliotecas miembros de WorldCat, se iniciará el 11 de febrero de 2025 una prueba piloto que involucrará la fusión de 500,000 pares de registros duplicados de libros impresos en inglés, que son la categoría más numerosa y la que ha recibido más pruebas hasta ahora.
Después de este primer ensayo, se evaluarán los resultados antes de realizar nuevas pasadas de eliminación de duplicados para los libros impresos en inglés. Una vez completada esta fase, OCLC continuará con la eliminación de duplicados en otros formatos, como materiales no bibliográficos y libros en idiomas distintos al inglés. Se recomienda a las bibliotecas que no usen WorldShare Management Services habilitar las actualizaciones de WorldCat en WorldShare Collection Manager para garantizar que reciban los registros actualizados.
Este esfuerzo, que combina la labor manual de los bibliotecarios con la tecnología avanzada de inteligencia artificial, ha logrado importantes avances en la reducción de duplicados en WorldCat. La eliminación de duplicados es una de las formas más efectivas de mejorar la calidad de WorldCat, y este enfoque automatizado permitirá a las bibliotecas ahorrar tiempo valioso y proporcionar una experiencia más precisa y eficiente para los usuarios, además de avanzar en la misión global de las bibliotecas.