Archivo de la categoría: Archivos

La publicación del patrimonio cultural en la era de la IA.

Keller, Paul. 2025. Publishing Cultural Heritage in the Age of AI. Con contribuciones de Alek Tarkowski, Antoine Isaac, Ariadna Matas Casadevall, Harry Verwayen y Lorena Dianel Aldana. Open Future Foundation. https://lnkd.in/dyxrT74y

El informe Publishing Cultural Heritage in the Age of AI, elaborado por la Open Future Foundation junto con Europeana Foundation, analiza uno de los desafíos más urgentes para las instituciones de patrimonio cultural en la actualidad: cómo compartir sus datos en un contexto marcado por el desarrollo acelerado de la inteligencia artificial.

El documento parte de una constatación clave: los modelos tradicionales de acceso a colecciones culturales fueron diseñados para el uso individual humano y resultan insuficientes ante la creciente demanda de acceso masivo y automatizado para el entrenamiento y uso de sistemas de IA.

El texto identifica una tensión estructural entre los compromisos históricos de acceso abierto de bibliotecas, archivos y museos, y la realidad del uso intensivo de datos por parte de actores tecnológicos, incluidos desarrolladores de IA generativa. Mientras que el acceso abierto ha promovido la democratización del conocimiento, el uso a gran escala de los datos culturales plantea interrogantes sobre la sostenibilidad institucional, la integridad del patrimonio, la atribución, la explotación comercial y la pérdida de control sobre los usos derivados.

Como respuesta, el informe propone un marco de acceso diferenciado, basado en principios de interés público. Este enfoque no rechaza el acceso abierto, sino que lo complementa con condiciones específicas para determinados usos de IA, distinguiendo entre reutilización alineada con el mandato público de las instituciones y usos que pueden requerir salvaguardas adicionales. El objetivo es equilibrar tres pilares fundamentales: mantener el acceso abierto cuando sea apropiado, fomentar una innovación responsable y proteger la confianza pública en las instituciones patrimoniales.

El marco planteado ofrece orientaciones prácticas para que las instituciones culturales puedan decidir cuándo aplicar acceso abierto, acceso condicionado o acuerdos específicos, teniendo en cuenta factores como el tipo de datos, la finalidad del uso, el impacto social y la coherencia con sus misiones públicas. En lugar de establecer normas cerradas, el documento subraya la necesidad de una gobernanza reflexiva y contextual, capaz de adaptarse a distintos escenarios tecnológicos y legales.

Finalmente, el informe se presenta explícitamente como una invitación al diálogo y no como un modelo prescriptivo. Forma parte del proceso colectivo Alignment Assembly on Culture for AI, enmarcado en el espacio europeo común de datos para el patrimonio cultural. Desde esta perspectiva, el texto busca contribuir a una conversación más amplia sobre el papel de las instituciones culturales en la era de la IA y sobre cómo garantizar que el uso de los datos patrimoniales siga sirviendo al interés público y a los valores democráticos.

ALA, ARL y CARL se unen a la lucha para defender la memoria futura

Michael Menna (2025, 3 diciembre). ALA, ARL, and CARL Join the Fight to Defend Our Future Memory. Archivo de blog de Internet Archive https://blog.archive.org/2025/12/03/ala-arl-and-carl-join-the-fight-to-defend-our-future-memory/

Las tres grandes organizaciones bibliotecarias de Norteamérica —American Library Association (ALA), Association of Research Libraries (ARL) y Canadian Association of Research Libraries (CARL) — han decidido adherirse oficialmente a la declaración de los “Cuatro Derechos Digitales para Instituciones de Memoria” impulsada por la campaña Our Future Memory

La adhesión de estas asociaciones supone un respaldo significativo: representan miles de bibliotecas públicas y universitarias, además de incluir tres de las bibliotecas federales y parlamentarias de Canadá.

Según CARL, citada en el artículo, el panorama digital —con materiales disponibles únicamente en plataformas en línea— amenaza la capacidad de estas instituciones para cumplir su misión histórica de recolectar, preservar y poner a disposición obras para futuras generaciones. Si no se garantiza su derecho a operar en el entorno digital, muchos trabajos académicos y culturales podrían perderse para siempre.

El artículo recuerda que la declaración de los “Cuatro Derechos Digitales” no solicita nada más allá de lo básico y necesario para que bibliotecas, archivos, museos y otras instituciones de patrimonio sigan funcionando como lo hicieron en el mundo analógico, pero adaptados a un entorno digital —es decir: poder recolectar contenido digital, preservarlo, ofrecer acceso controlado, y cooperar con otras instituciones.

En pocas palabras, los derechos y responsabilidades que las instituciones de la memoria siempre han disfrutado fuera de línea también deben protegerse en línea. Para lograr este objetivo, las bibliotecas, archivos y museos deben tener los derechos legales y la capacidad práctica para:

  • Recopilar materiales en formato digital, ya sea mediante la digitalización de colecciones físicas, la compra en el mercado libre o por otros medios legales;
  • Preservar los materiales digitales y, cuando sea necesario, repararlos, realizar copias de seguridad o reformatearlos, para garantizar su existencia y disponibilidad a largo plazo;
  • Proporcionar acceso controlado a los materiales digitales para técnicas de investigación avanzadas y para atender a los usuarios dondequiera que se encuentren: en línea;
  • Cooperar con otras instituciones de la memoria, compartiendo o transfiriendo colecciones digitales, para facilitar la preservación y el acceso.

Con la incorporación de ALA, ARL y CARL, la coalición global que defiende estos derechos digitales gana aún más fuerza: se amplía su representatividad, lo que puede incidir con mayor peso en políticas, normativas y decisiones sobre preservación del patrimonio digital.

Ciudadanos archiveros: programa de participación ciudadana en la preservación documental

Citizen Archivist

https://www.archives.gov/citizen-archivist/missions

Citizen Archivist es un programa voluntario dirigido por National Archives cuyo objetivo es involucrar a personas del público general en la clasificación, transcripción y etiquetado de documentos históricos

A través de este programa, cualquier persona con una cuenta puede acceder al catálogo digital de archivos, revisar imágenes y documentos escaneados y contribuir para hacerlos más accesibles: añadiendo “tags” (etiquetas), transcribiendo textos (especialmente manuscritos antiguos o documentos difíciles de leer) o comentando los hallazgos.

El propósito fundamental es —como dice NARA— “preservar, proteger y compartir los registros históricos” para promover la indagación pública y fortalecer la participación democrática.

Dentro del programa Citizen Archivist, las “Missions” son convocatorias temáticas específicas: conjuntos de documentos seleccionados que necesitan trabajo de transcripción o etiquetado.

  • Cada misión está centrada en un tema histórico concreto (guerra, inmigración, registros personales, sucesos, fotografía, etc.), lo que permite orientar los esfuerzos de quienes participan según intereses particulares.
  • Al hacer clic en una misión, el usuario es llevado directamente a los registros incluidos en ella, para comenzar a trabajar.
  • Las misiones se actualizan con regularidad: se añaden nuevas, otras terminan, y algunas permanecen disponibles para quienes las quieran revisar.

Las contribuciones de quienes participan como archivistas ciudadanos se agrupan en dos tareas principales:

  • Transcripción: consiste en reproducir en formato digital, legible y buscable el contenido de documentos originales como manuscritos, cartas, formularios o informes. Esta labor resulta fundamental cuando se trata de materiales antiguos, escritos a mano o con tipografías difíciles de interpretar. Gran parte de estos documentos —correspondencia, solicitudes, peticiones, expedientes o reportes oficiales— aguardan ser transcritos para que su información pueda consultarse de manera accesible por cualquier persona.
  • Etiquetado (“tagging”): implica añadir palabras clave o descriptores a imágenes, documentos y expedientes. Estas etiquetas permiten que el contenido pueda localizarse fácilmente mediante búsquedas y mejoran la organización del catálogo, facilitando la labor tanto de investigadores como del público general.

En algunos casos, la transcripción requiere un nivel de experiencia mayor —por ejemplo, cuando los documentos están muy dañados, presentan una caligrafía extremadamente difícil o contienen anotaciones casi ilegibles—. Para estas situaciones se crean misiones específicas denominadas “Transcriber Task Force”, en las que participan personas con mayor pericia en la lectura y transcripción de materiales complejos.

PAPR: un registro colaborativo para preservar colecciones impresas de revistas y otras publicaciones seriadas en bibliotecas

PAPR (Print Archives Preservation Registry) 

https://papr.crl.edu/

PAPR  es un registro que reúne información sobre qué bibliotecas conservan colecciones impresas de revistas y otras publicaciones seriadas. Su función principal es ayudar a que estas instituciones coordinen la preservación del papel, evitando duplicidades innecesarias y garantizando que siempre exista un número suficiente de copias para proteger el patrimonio documental.

Gracias a este sistema, las bibliotecas pueden saber qué títulos conserva cada institución, qué años o volúmenes exactos poseen y qué compromisos de preservación han asumido a largo plazo.

Este registro actúa como un repositorio colectivo de datos, permitiendo que las bibliotecas compartan sus datos de tenencia y compromisos de preservación. Gracias a esto, los miembros pueden analizar solapamientos entre colecciones, planear políticas de retención o descarte, y tomar decisiones informadas para gestionar sus colecciones impresas.

El sistema se ha renovado recientemente con la plataforma TIND ILS, que permite gestionar grandes volúmenes de datos de forma más rápida, clara y eficiente. Con esta actualización, PAPR ofrece mejores herramientas de búsqueda, análisis y comparación entre colecciones, lo que facilita la toma de decisiones sobre qué conservar, qué retirar y cómo colaborar entre bibliotecas. En conjunto, PAPR se convierte en una herramienta esencial para investigadores, profesionales de la información y gestores de preservación que necesitan localizar material impreso o planificar su conservación futura.

El uso de la inteligencia artificial (IA) en el análisis de archivos históricos.

Henley, Amanda, y Matt Jansen. On the Books: Jim Crow and Algorithms of Resistance. Universidad de Carolina del Norte en Chapel Hill. Última modificación septiembre de 2025. https://onthebooks.lib.unc.edu/

La iniciativa On the Books, liderada por las Bibliotecas de la Universidad de Carolina del Norte en Chapel Hill (UNC), ha recibido una subvención de 765.000 dólares de la Fundación Mellon para ampliar el uso de la inteligencia artificial (IA) en el análisis de archivos históricos.

Este proyecto busca mejorar el acceso y la comprensión de materiales archivísticos relacionados con comunidades históricamente marginadas, como afroamericanos, indígenas y latinos.

La fase actual del proyecto se centra en la identificación de leyes discriminatorias, conocidas como «Juan Crow», en el estado de Texas. Además, se explorarán aplicaciones de IA para la creación de corpora textuales a partir de documentos legales históricos, la generación de descripciones automáticas de colecciones fotográficas y el reconocimiento de caracteres manuscritos en documentos archivísticos. Estas iniciativas buscan facilitar la búsqueda y el análisis de materiales históricos, promoviendo una mayor accesibilidad y comprensión de los mismos.

El proyecto fomenta la colaboración entre bibliotecas, archivos, facultades de derecho y comunidades locales. Además, ofrece becas de investigación y enseñanza para estudiantes y académicos interesados en utilizar las técnicas desarrolladas en el proyecto, promoviendo así la formación de una nueva generación de profesionales capacitados en el uso de tecnologías avanzadas para el estudio de la historia.

La integración de la IA en el análisis de archivos históricos permite a los investigadores abordar preguntas complejas sobre la evolución de las leyes y políticas discriminatorias, facilitando la identificación de patrones y conexiones que podrían pasar desapercibidos mediante métodos tradicionales. Este enfoque innovador también tiene el potencial de transformar la enseñanza de la historia, proporcionando a los estudiantes herramientas digitales avanzadas para explorar y analizar fuentes primarias de manera más eficiente y profunda.

Se espera que los resultados de esta fase del proyecto sirvan como modelo para otras instituciones que buscan integrar la IA en la investigación y enseñanza de la historia. Al compartir sus hallazgos y metodologías, el equipo de On the Books busca contribuir al desarrollo de prácticas archivísticas más inclusivas y accesibles, promoviendo una comprensión más completa y equitativa del pasado.

Este esfuerzo se alinea con iniciativas similares en otras instituciones, como la colaboración entre la Biblioteca Pública de Boston y la Universidad de Harvard, que también están utilizando la IA para mejorar el acceso a archivos históricos y promover la justicia social. Estas iniciativas reflejan un movimiento creciente hacia la digitalización y el análisis avanzado de materiales archivísticos, con el objetivo de hacer que la historia sea más accesible y relevante para las generaciones actuales y futuras.

Cuadernillo de metodología para la elaboración del análisis del estado material de documentos históricos

Archivo General de la Nación (AGN). Cuadernillo de Metodología para la Elaboración del Análisis del Estado Material de Documentos Históricos. Ciudad de México: AGN, 17 de septiembre de 2024.

Texto completo

Elaborado por la Dirección de Preservación del Patrimonio Documental del AGN, el cuadernillo responde a la necesidad de emitir dictámenes técnicos sobre la autenticidad de documentos históricos. Está dirigido a instituciones públicas, comunidades indígenas, investigadores y ciudadanos que requieran evaluar la integridad material de archivos con valor histórico y jurídico.

La publicación surge en el contexto de la creación del Departamento de Investigación, Dictaminación y Análisis Material del Patrimonio Documental (DIDAMPD), consolidado en 2023 como parte de una estrategia para fortalecer los servicios de conservación documental del AGN. A través de este cuadernillo, se sistematizan procedimientos empleados previamente, con el fin de estandarizar criterios y prácticas a nivel nacional.

El documento describe en detalle cada fase del análisis, comenzando con la caracterización del soporte documental, incluyendo tipo de papel, medidas, filigranas, tintas, encuadernación y signos visibles de deterioro o alteración. Para ello, se emplean técnicas organolépticas (basadas en la observación), luz natural y artificial, y herramientas especializadas como la luz ultravioleta, luz infrarroja y microscopía óptica. También se contempla el uso de fichas clínicas digitales y bitácoras que permiten registrar todos los hallazgos de manera estructurada y verificable.

Una de las fortalezas del cuadernillo es su enfoque práctico y replicable. Incluye ejemplos visuales, recomendaciones sobre manejo físico del documento, y un esquema de dictamen que facilita la emisión de informes técnicos. Esto permite que archivos estatales, municipales, e incluso colecciones particulares puedan aplicar estos criterios para evaluar su acervo documental con mayor rigor.

¿Están los robots de inteligencia artificial desplazando al patrimonio cultural?

Weinberg, Michael. 2025. “Are AI Bots Knocking Cultural Heritage Offline?GLAM‑E Lab, abril 2025. https://www.glamelab.org/products/are-ai-bots-knocking-cultural-heritage-offline/.

El informe “Are AI Bots Knocking Cultural Heritage Offline?”, publicado en abril de 2025 por GLAM‑E Lab y escrito por Michael Weinberg, documenta el creciente problema que enfrentan colecciones culturales digitales (museos, bibliotecas, archivos y galerías) frente a bots de IA que rastrean y copian masivamente sus contenidos. En muchas instituciones, una oleada inesperada de tráfico automatizado ha generado sobrecarga en los servidores, ralentizaciones o incluso caídas temporales del servicio.

A finales de 2024, empezaron a surgir relatos aislados de colecciones individuales de patrimonio cultural en línea. Estos relatos describían servidores y colecciones que se agotaban -y a veces se rompían- bajo la carga de un enjambre de bots. Al parecer, los bots extraían todos los datos de las colecciones para crear conjuntos de datos con los que entrenar modelos de inteligencia artificial.

El laboratorio GLAM-E encuestó a docenas de instituciones GLAM (galerías, bibliotecas, archivos y museos) para empezar a responder a estas preguntas. Este informe, publicado en junio de 2025, documenta cómo las instituciones se ven sometidas a la presión de los bots y cómo las cosas pueden empeorar antes de mejorar.

Estas son algunas de las cuestiones más relevantes del informe:

  • Los bots están muy extendidos, aunque no son universales. De los 43 encuestados, 39 experimentaron un aumento reciente en el tráfico. Veintisiete de esos 39 atribuyeron el aumento al tráfico de bots que recolectan datos para entrenamiento de IA, y otros siete sospechan que los bots podrían estar contribuyendo al incremento.
  • Este aumento de tráfico ha sido difícil de anticipar, ya que pocos encuestados estaban monitorizando activamente el tráfico de bots antes de que estos provocaran una crisis en sus colecciones. Muchos no se dieron cuenta de que estaban recibiendo tráfico de bots hasta que dicho tráfico saturó el servicio y dejó las colecciones digitales fuera de línea.
  • Algunos encuestados comenzaron a notar un incremento en el tráfico de bots desde 2021, mientras que otros no lo experimentaron hasta 2025.
  • Algunos bots se identifican claramente, mientras que otros emplean diversas estrategias para ocultar su origen.
  • Cuando los bots aparecen, tienden a hacerlo en enjambres durante períodos relativamente breves. La frecuencia de estos enjambres podría estar aumentando.
  • El archivo robots.txt no es actualmente un método eficaz para impedir que los bots saturen las colecciones.
  • Los encuestados están implementando una variedad de contramedidas, tanto propias como de terceros, basadas en cortafuegos, para intentar filtrar los bots según la dirección IP, la geografía, el dominio o el agente de usuario. Algunas de estas medidas parecen funcionar, aunque pocos tienen confianza en que sean sostenibles a largo plazo.
  • Los encuestados se muestran reacios a adoptar medidas más agresivas, como colocar las colecciones detrás de pantallas de inicio de sesión, por diversas razones: dudas sobre su eficacia a medio plazo, preocupaciones por los efectos negativos en los usuarios legítimos, y el temor de que tales restricciones contradigan su objetivo principal de mantener las colecciones libremente accesibles en línea.
  • Los encuestados temen que los enjambres de bots de entrenamiento de IA generen un entorno de costos crecientes insostenibles para ofrecer acceso en línea a las colecciones.

Los hallazgos exponen que muchas colecciones no detectaron la actividad de los bots hasta que los sistemas dejaron de responder, lo que obligó a implementar contramedidas rápidas, como cortafuegos específicos (e.g., Cloudflare, AWS), o considerar el uso de restricciones por IP, regiones geográficas, o agentes de usuario. Aunque algunas medidas temporales han funcionado, la mayoría de entrevistados reconoce que no son fiables a largo plazo .

El informe concluye que el problema es extensible y creciente, dada la expansión de los bots de IA desde 2021. Advierte que, sin una estrategia concertada que combine soluciones tecnológicas y nuevos estándares comunitarios, la capacidad de mantener colecciones digitales abiertas y accesibles podría verse comprometida por los costos de infraestructura y la presión técnica insostenible .

Alfonso López Yepes presenta el libro «Cine español en línea (1982-2024)». Planeta Biblioteca 2025/06/11

Alfonso López Yepes presenta el libro «Cine español en línea (1982-2024)»

Planeta Biblioteca 2025/06/11.

ESCUCHAR

Descargar

En la entrevista, Alfonso López Yepes presenta su libro Cine español en línea (1982-2024), una obra que documenta y analiza el patrimonio fílmico informativo, especialmente centrado en el cine español e iberoamericano. Destaca la evolución del tratamiento documental del cine en el entorno digital y el papel clave de las filmotecas en línea, el canal RTVDoc y la Inteligencia Artificial en la preservación y difusión audiovisual. Subraya la importancia de una narrativa transmedia y de las redes sociales como herramientas útiles pero ambivalentes. El libro está dirigido tanto al ámbito académico como al público general interesado.

Papeles que suenan: el tratamiento de los fondos documentales de música durante el último quindenio

Assunção, Clara, Paulo Castagna, María José González Ribot, Antonio Álvarez Cañibano e Isabel Lozano Martínez. Papeles que suenan: el tratamiento de los fondos documentales de música durante el último quindenio. Salamanca: Catedral de Salamanca, 2023

Texto completo

El libro Papeles que suenan. El tratamiento de los fondos documentales de música durante el último quindenio (Salamanca: Catedral de Salamanca, 2023) es una recopilación de ponencias presentadas en una mesa redonda organizada por la Catedral de Salamanca con motivo del XV aniversario de la publicación de El archivo de los sonidos. Esta obra analiza la evolución de la archivística musical en Iberoamérica durante los últimos quince años, abordando temas como la gestión de archivos musicales en Portugal y Brasil, los desafíos de la era digital para los centros de documentación musical, y la documentación musical en el Portal de Archivos Españoles (PARES). Además, se incluye un dossier fotográfico que complementa visualmente los contenidos tratados

Este libro forma parte de la colección «Extravagantes» de la Catedral de Salamanca y está disponible para su descarga gratuita en el siguiente enlace: Catedral de Salamanca+1SALAMANCArtv

Archivo General de la Administración: guía básica de fuentes

Ministerio de Cultura. Archivo General de la Administración. Guía básica de fuentes. Madrid: Ministerio de Cultura, 2024. https://libreria.cultura.gob.es/libro/archivo-general-de-la-administracion_11894/

El Archivo General de la Administración (AGA) es, de los ocho archivos nacionales, el que conserva nuestra memoria histórica más reciente, ya que sus fondos se refieren fundamentalmente al siglo XX, y de manera especial a su segunda mitad, aunque también custodia un importante volumen de fondos de la segunda mitad del siglo XIX.
Es uno de los archivos estatales más vastos del mundo y su consulta es obligada para obtener cualquier antecedente sobre la arquitectura, el urbanismo, las obras públicas, la educación, la cultura, el turismo, la economía, la hacienda, la justicia, etc., en la etapa contemporánea, ya que recibe periódicamente los documentos en los que se plasma la actividad de los diferentes organismos de la Administración General del Estado cuando ya no son necesarios para la gestión diaria de las oficinas.