Archivo de la etiqueta: Preservación digital

El papel de la inteligencia artificial en la preservación digital de bibliotecas y archivos históricos

Teel, Zoë (Abbie). «Artificial Intelligence’s Role in Digitally Preserving Historic Archives» Preservation, Digital Technology & Culture, vol. 53, no. 1, 2024, pp. 29-33. https://doi.org/10.1515/pdtc-2023-0050

La IA en las bibliotecas ha sido un tema de interés de tendencia durante algún tiempo, ya que dentro de la biblioteca hay numerosos departamentos que cumplen la función de contribuir colectivamente a la misión de la biblioteca. En consecuencia, es imperativo considerar la influencia de la IA en la preservación digital de documentos históricos. Este artículo profundiza en la evolución histórica de los métodos de preservación impulsados ​​por los avances tecnológicos ya que, a lo largo de la historia, bibliotecas, archivos y museos han enfrentado el desafío de preservar colecciones históricas, mientras que muchos de los métodos de preservación tradicionales son costosos e implican mucho trabajo manual. esfuerzo (humano). El hecho de que la IA sea el catalizador de la transformación podría cambiar esta realidad y quizás redefinir el proceso de preservación; Por lo tanto, este artículo explora la tendencia emergente de incorporar la tecnología de IA en las prácticas de preservación y proporciona predicciones sobre el papel transformador de la Inteligencia Artificial en la preservación para el futuro. Con eso en mente, este artículo aborda las siguientes preguntas: ¿podría la IA ser lo que cambia o crea un cambio de paradigma en la forma en que se realiza la preservación?; ¿Y podría ser eso lo que cambiará la forma en que se salvaguarda la historia?

Millones de artículos académicos en riesgo de desaparecer del Internet: un estudio revela lagunas en la preservación digital

Millions of research papers at risk of disappearing from the Internet. En: Bandiera_abtest: a Cg_type: News Subject_term: Information technology, Scientific community, Publishing [en línea], 2024. [consulta: 3 mayo 2024]. Disponible en: https://www.nature.com/articles/d41586-024-00616-5.


Un estudio sobre más de siete millones de publicaciones digitales sugiere que más de una cuarta parte de los artículos académicos no están siendo archivados y preservados adecuadamente. Esto indica que los sistemas de preservación en línea no están manteniendo el ritmo del crecimiento de la producción investigativa.

Martin Eve, investigador de literatura, tecnología y publicación en la Universidad de Birkbeck, Londres, señala que la cadena de notas al pie es esencial para la epistemología científica y de investigación. Sin embargo, más de dos millones de artículos con identificadores digitales únicos (DOI) no aparecían en archivos digitales importantes, a pesar de tener un DOI activo.

El estudio examinó si 7.438,037 obras con DOI estaban archivadas. Solo el 58% de los DOI referenciaban obras almacenadas en al menos un archivo digital. Esto plantea desafíos significativos para la preservación digital, especialmente para editoriales pequeñas que pueden carecer de recursos.

El análisis sugiere medidas para mejorar la preservación digital, como requisitos más estrictos en las agencias de registro de DOI y una mayor conciencia del problema entre editores e investigadores. Eve destaca la importancia de garantizar la sostenibilidad a largo plazo del ecosistema de investigación.

Google elimina la función de páginas en caché

Southern, Matt G. «Google Retires Cached Site Links, Pushing Users Towards Internet Archive». Search Engine Journal, 5 de febrero de 2024. https://www.searchenginejournal.com/google-retires-cached-site-links-pushing-users-towards-internet-archive/507128/.

La caché de Google, puede definirse como la memoria de Google que graba temporalmente instantáneas o copias de páginas web durante el paso de los rastreadores. El objetivo del motor de búsqueda es esencialmente crear una copia de seguridad de los sitios rastreados para reducir el tiempo de respuesta del procesamiento de la solicitud, pero también para mostrar la página solicitada por el usuario de Internet, incluso si el servidor de alojamiento del sitio se encuentra con un problema.


Google ha decidido poner fin a la función de páginas en caché, que durante mucho tiempo ha servido como una alternativa para cargar sitios web caídos o modificados. Según Danny Sullivan, de Google Search Liaison, esta función fue originalmente creada para ayudar a las personas a acceder a páginas cuando la carga no era confiable, pero con la mejora de la infraestructura de Internet, la compañía ha optado por retirarla. Aunque actualmente no se ven enlaces en caché en la búsqueda de Google, aún es posible acceder a versiones en caché mediante enlaces personalizados o escribiendo «cache:» seguido de la URL en la búsqueda de Google. Este cambio representa un hito significativo en la forma en que Google almacena y muestra el contenido web, lo que también tendrá un impacto en la percepción y el archivado de información en la web en general.

La desaparición de los enlaces en caché significa que el Internet Archive tendrá una carga de trabajo aún mayor en la tarea de archivar y rastrear los cambios en las páginas web del mundo. Además, este cambio podría tener implicaciones en cómo se comprende el funcionamiento del «Google Bot» web crawler y cómo se visualizan las páginas en el tiempo. Si bien esta decisión probablemente ayudará a Google a reducir sus costos y liberar recursos, plantea preguntas sobre la disponibilidad de información histórica y la transparencia en la visualización de datos web. En última instancia, la eliminación de la función de páginas en caché refleja una evolución en el panorama de la web y cómo se accede y se almacena la información en línea.

Wayback Machine Browser: herramienta para acceso a páginas web ya nos disponibles

Wayback Machine

Extensión

Wayback Machine Browser es una herramienta que permite acceder al vasto archivo de páginas web almacenadas por Wayback Machine, que ha estado archivando páginas web desde 1996 y ofrece una gran colección de instantáneas de sitios web a lo largo del tiempo.

Internet Archive, una organización sin fines de lucro, está construyendo una biblioteca digital de sitios web y otros documentos culturales en forma digital. Al igual que una biblioteca de papel, proporciona acceso gratuito a investigadores, historiadores, académicos, personas con discapacidades visuales y el público en general. 

Internet Archive comenzó en 1996 archivando el propio Internet, un medio que apenas comenzaba a crecer en uso. Como los periódicos, el contenido publicado en la web era efímero, pero a diferencia de los periódicos, nadie lo estaba guardando. Hoy en día tiene más de 28 años de historia web accesible a través de la Wayback Machine y trabaja con más de 1.200 bibliotecas y otros socios a través del programa Archive-It para identificar páginas web importantes.

Hoy en día su archivo contiene:

  • 835 mil millones de páginas web
  • 44 millones de libros y textos
  • 15 millones de grabaciones de audio (incluyendo 255,000 conciertos en vivo)
  • 10.6 millones de videos (incluyendo 2.6 millones de programas de noticias televisivas)
  • 4.8 millones de imágenes
  • 1 millón de programas de software

Wayback Machine (La Máquina del Tiempo) fue creado en 1996 y lanzada al público en 2001, permite al usuario retroceder en el tiempo para ver cómo eran los sitios web en el pasado. Sus fundadores, Brewster Kahle y Bruce Gilliat, desarrollaron la Máquina del Tiempo con el fin de proporcionar «acceso universal a todo el conocimiento» mediante la preservación de copias archivadas de páginas web desaparecidas.

Wayback Machine utiliza un software desarrollado para «rastrear» la web y descargar toda la información y archivos de datos públicamente accesibles en las páginas web, la jerarquía Gopher, el sistema de tablones de anuncios de Netnews (Usenet) y el software descargable. La información recopilada por estos «rastreadores» no incluye toda la información disponible en Internet, ya que gran parte de los datos están restringidos por el editor o almacenados en bases de datos que no son accesibles. Para superar las inconsistencias en los sitios web parcialmente en caché, se desarrolló Archive-It.org en 2005 como un medio que permite a las instituciones y creadores de contenido almacenar y preservar voluntariamente colecciones de contenido digital y crear archivos digitales.

Los objetivos principales del Wayback Machine Browser son:

  1. Preservación digital: El objetivo principal de la Wayback Machine es preservar el contenido de la web para las generaciones futuras. Al archivar sitios web, se asegura de que la información y el contenido en línea estén disponibles incluso si los sitios originales desaparecen o cambian con el tiempo.
  2. Acceso a la historia de la web: Permite a los usuarios explorar cómo han evolucionado los sitios web a lo largo del tiempo. Esto es útil para investigadores, historiadores y cualquier persona interesada en rastrear cambios en el diseño, contenido y políticas de sitios web a lo largo de los años.
  3. Recuperación de contenido perdido: Cuando un sitio web cambia o se elimina, el Wayback Machine puede proporcionar una copia de cómo era el sitio en el pasado. Esto puede ser útil para recuperar contenido perdido o acceder a versiones anteriores de un sitio.
  4. Transparencia y rendición de cuentas: La Wayback Machine también sirve como una herramienta de transparencia y rendición de cuentas al permitir a los usuarios verificar la información presentada en línea en el pasado y compararla con la información actual. Esto puede ser útil para verificar cambios en políticas, declaraciones públicas y otros aspectos de sitios web a lo largo del tiempo.

El cine antiguo y mudo de lo analógico a lo digital.

Ingravalle, Grazia. 2024. Archival Film Curatorship: Early and Silent Cinema from Analog to Digital. Amsterdam University Press. https://doi.org/10.5117/9789463725675.

Texto completo

Archival Film Curatorship es el primer libro que investiga los archivos cinematográficos en la intersección de las historias institucionales, la historiografía del cine antiguo y mudo y el comisariado de archivos. Examina tres instituciones a la vanguardia de la experimentación con la exhibición y el comisariado de películas. El Eye Film Museum de Ámsterdam, el George Eastman Museum de Rochester (Nueva York) y el National Fairground and Circus Archive de Sheffield (Reino Unido) sirven como lugares ejemplares de mediación histórica entre el cine antiguo y mudo y la era digital. Una serie de elementos, desde protocolos de conservación a tecnologías de exhibición y desde arquitecturas museísticas a discursos curatoriales en blogs, catálogos y entrevistas, conforman lo que el autor teoriza de forma innovadora como el dispositivo hermenéutico del archivo. Archival Film Curatorship ofrece a los estudiosos del cine y la conservación una visión única de las cambiantes definiciones, historias y usos del medio cinematográfico por parte de quienes se encargan de preservarlo y presentarlo a las nuevas audiencias de la era digital.

Lista mundial de especies digitales en peligro de extinción: Día Internacional de la Preservación Digital

«Is data loss a choice? Global ‘Bit List’ of Endangered Digital Species 2023 released on World Digital Preservation Day – Digital Preservation Coalition». Accedido 3 de noviembre de 2023. https://www.dpconline.org/news/it-list-2023-is-data-loss-a-choice.

Texto completo

La Coalición para la Preservación Digital (Digital Preservation Coalition) ha publicado hoy, Día Mundial de la Preservación Digital, su edición 2023 de la «List’ of Endangered Digital Species»

La Lista Mundial de Especies Digitales en Peligro de la DPC, es un recurso abierto para la defensa de la preservación digital, es una lista comunitaria de materiales digitales en peligro que se revisa cada dos años. Las entradas de la lista son propuestas por la comunidad, que está a la vanguardia de los esfuerzos de preservación digital, y son revisadas por el Consejo de la Bit List, un grupo de organizaciones internacionales que representan la experiencia mundial en la preservación de las especies digitales incluidas en la lista.

En 2023, la Bit List incluye 87 entradas, lo que supone un notable aumento con respecto a las 73 de 2021. Aunque entre las nuevas entradas más significativas se incluye «‘First Nations Secret/Sacred Cultural Material», otras entradas se han reestructurado, fusionado y desagregado, lo que ha contribuido a este aumento general.

En respuesta a la aparente inercia, y en un contexto de riesgo cada vez mayor, el CPD tiene una serie de recomendaciones básicas.

  • Hace un llamamiento a auditores, reguladores y legisladores para que formulen planes que exijan un mayor nivel de competencia y atención a la preservación digital en el contexto de las industrias reguladas y las autoridades públicas para prevenir la pérdida de datos, reconociendo los perjuicios reputacionales y reales para las partes interesadas, para ellas mismas y para las generaciones futuras que se derivan, y que son totalmente evitables.
  • Pide a los tribunales y a las fuerzas y cuerpos de seguridad que utilicen todo el peso de la ley para perseguir las pérdidas de datos que se produzcan por negligencia criminal o prevaricación, especialmente aquellas supresiones que pongan de manifiesto una mala conducta profesional o impidan la rendición pública de cuentas.
  • Pide a los responsables del tratamiento de datos, a los directores de tecnología y a los comités de auditoría de las empresas que reconozcan que los compromisos a largo plazo no pueden cumplirse únicamente a base de proyectos y que, por tanto, integren los proyectos de preservación digital a corto plazo y exploratorios en planes estratégicos a más largo plazo.

El informe 2023 Bit List también es alentador y recuerda a los usuarios que la preservación digital es factible. Las «honrosas excepciones» a las que se refiere el Dr. Currie son dos entradas que han pasado a clasificaciones de menor riesgo. La reclasificación de los «Datos de investigación publicados anexos a artículos de revistas» y de los «Datos de investigación no publicados» se basa en mejoras sólidas y materiales. En estos casos y en el pequeño número de tendencias de mejora, el consejo de la Lista de Bits ha podido identificar el impacto de las aclaraciones políticas y los lugares en los que se han aplicado el esfuerzo y la experiencia.

Library Copyright Alliance apoya la exención de la Oficina de Derechos de Autor de EE.UU. para que bibliotecas, archivos y museos puedan crear copias de preservación

Association of Research Libraries. «Library Copyright Alliance Supports US Copyright Office Exemption for Libraries, Archives, and Museums Breaking Digital Locks to Create Preservation Copies». Accedido 27 de octubre de 2023. https://www.arl.org/news/library-copyright-alliance-supports-us-copyright-office-exemption-for-libraries-archives-and-museums-breaking-digital-locks-to-create-preservation-copies/.

Este artículo analiza el apoyo de la Library Copyright Alliance (LCA) a la exención de la Oficina de Derechos de Autor de los Estados Unidos que permite a las bibliotecas, archivos y museos desbloquear discos DVD y Blu-ray con el propósito de crear copias de preservación.

El cambio climático, los conflictos humanos y las catástrofes naturales suponen riesgos para la vida y la salud de las personas, así como para las colecciones de materiales del patrimonio cultural. Para proteger estas valiosas colecciones en previsión de pérdidas debidas a catástrofes o al deterioro normal, las bibliotecas y los archivos deben evitar los bloqueos digitales de las obras de sus colecciones con el fin de preservarlas.

La Oficina de Derechos de Autor de los EE.UU. está de acuerdo: en su reciente notificación de propuesta de normativa, la oficina anunció su intención de renovar una exención que permite a las bibliotecas, archivos y museos que cumplan los requisitos romper los bloqueos digitales de los DVD y discos Blu-ray de sus colecciones al crear copias de conservación o sustitución de películas, incluidos programas de televisión y vídeos. La oficina concedió esta exención por primera vez en 2021; el actual ciclo de reglamentación es la primera vez que la exención se renueva.

Como parte de la actual reglamentación trienal de la Ley de Derechos de Autor para el Milenio Digital (DMCA), la Library Copyright Alliance (LCA) solicitó a la Oficina de Derechos de Autor la renovación de esta exención, aportando el testimonio de que «las instituciones de patrimonio cultural de todo el país han confiado en la exención… para hacer copias de conservación y sustitución de las películas de sus colecciones almacenadas en DVD y discos Blu-ray», ya que muchas películas de las colecciones «no están disponibles para su compra o transmisión» y los discos «siguen deteriorándose».

El LCA agradece que esta exención ofrezca a bibliotecas, archivos y museos la certeza de que romper los candados digitales para preservar las películas de sus colecciones no infringe el artículo 1201 de la DMCA. Pero las licencias de obras académicas digitales y materiales del patrimonio cultural pueden seguir representando un obstáculo si prohíben la conservación, el uso justo o la elusión de las medidas técnicas de protección.

La intervención del Congreso puede ser necesaria para aclarar que las excepciones y limitaciones previstas en la Ley de Derechos de Autor de EE.UU., o a través de la reglamentación de la Sección 1201, prevalecen sobre los términos de licencia que son incompatibles con esas exenciones. Por ejemplo, la Oficina de Derechos de Autor de EE.UU. ha propuesto un modelo de texto que establece que las bibliotecas, archivos y museos no serán responsables de infracción de los derechos de autor si realizan copias de conservación de obras cubiertas por cláusulas contractuales no negociables que prohíben tales actividades. La Ley de Derechos de Autor de Estados Unidos también podría modificarse para establecer que dichas cláusulas contractuales no son ejecutables.

En resumen, el artículo destaca la importancia de la exención que permite a las bibliotecas, archivos y museos desbloquear bloqueos digitales con fines de preservación y la necesidad de protecciones legales y claridad ante posibles barreras impuestas por los términos de licencia. Puede ser necesaria una acción del Congreso para reforzar estas protecciones.

Estudio sobre la disponibilidad comercial de videojuegos clásicos: casi el 90% de los videojuegos han desaparecido del mercado

Phil Salvador. (2023). Survey of the Video Game Reissue Market in the United States. Zenodo. https://doi.org/10.5281/zenodo.7996492

Texto completo

La Video Game History Foundation, en colaboración con la Software Preservation Network, ha realizado el primer estudio sobre la disponibilidad comercial de videojuegos clásicos, y los resultados son desoladores. El 87% de los videojuegos clásicos lanzados en Estados Unidos están en peligro crítico.

Imagina que la única forma de ver Titanic fuera encontrar una cinta VHS usada y mantener tu propio equipo antiguo para poder seguir viéndola. ¿Y si ninguna biblioteca, ni siquiera la Biblioteca del Congreso, pudiera hacerlo mejor? Podrían conservar y digitalizar ese VHS de Titanic, pero tendrías que ir hasta allí para verlo. Parece una locura, pero esa es la realidad que vivimos con los videojuegos, una industria de 180.000 millones de dólares, mientras los juegos y su historia desaparecen.

Para acceder a casi 9 de cada 10 juegos clásicos, hay pocas opciones: buscar y mantener juegos y hardware vintage de colección, viajar por todo el país para visitar una biblioteca o… la piratería. Ninguna de estas opciones es deseable, lo que significa que la mayoría de los videojuegos son inaccesibles salvo para los aficionados más acérrimos y dedicados. Esto es bastante triste.

Aquí es donde deberían entrar las bibliotecas y los archivos. Cualquiera debería poder explorar, investigar y jugar fácilmente a videojuegos clásicos, del mismo modo que puede leer novelas clásicas, escuchar álbumes clásicos y ver películas clásicas. Pero las obsoletas leyes de derechos de autor impiden a instituciones como la nuestra hacer nuestro trabajo.

Factores económicos de la preservación documental digital : actualización 2021

Voutssas Marquez, Juan. Factores económicos de la preservación documental digital : actualización 2021. Universidad Nacional Autónoma de México. Instituto de Investigaciones Bibliotecológicas y de la Información, 2022

Texto completo

El enorme incremento de información digital a nivel mundial implica que gran parte de ella debe ser preservada adecuadamente por parte de bibliotecas, archivos, repositorios y otras organizaciones al efecto. La adecuada preservación documental digital –entre otros factores– conlleva costos que no siempre son percibidos integralmente por los directivos de las organizaciones y los responsables de la preservación. A pesar de que a lo largo del tiempo se han elaborado múltiples estudios al respecto, el cambiante entorno tecnológico, el advenimiento de servicios especializados al efecto en la nube, etcétera, han modificado los parámetros para presupuestarla, y por lo mismo requieren que el cálculo de los costos de esta tarea deba ser analizado a la luz de nuevos elementos y contextos emergentes con el fin de revisar el conocimiento al respecto y con ello poder actualizar las técnicas para costeo de la preservación documental digital.

La Biblioteca Pública de Los Ángeles cuenta con un laboratorio para que las personas puedan digitalizar soportes antiguos como cintas VHS y disquetes.

The Memory Lab | Los Angeles Public Library

El Laboratorio de la Memoria es un espacio para la digitalización gratuita de fotografías, documentos, grabaciones audiovisuales y otros formatos. Proporciona al personal y a los usuarios de la Biblioteca directrices, herramientas y formación para el archivo personal analógico y digital.


Cada vez más, los materiales que conforman la vida de las personas son más digitales, pero no todo el mundo tiene el equipo o los conocimientos necesarios para cuidarlos adecuadamente. Muchos formatos analógicos, como el VHS, se degradan con el tiempo y necesitan ser digitalizados antes de que las grabaciones se pierdan.

La Biblioteca Pública de Los Ángeles se suma a la preservación digital, con la creación de DIY Memory Lab, un nuevo espacio dentro de Octavia Lab en la Biblioteca Central. Con este laboratorio de autoservicio, los usuarios pueden preservar tesoros mediáticos del pasado utilizando herramientas de digitalización profesionales.

El uso del equipamiento del laboratorio es gratuito para los titulares de carnet de la Biblioteca Pública de Los Ángeles (que es gratuita para todos los residentes de California), aunque previamente debe de asistir a una orientación en línea y hacer una reserva.

La Biblioteca Pública de Los Ángeles ofrece los siguientes servicios para ayudar a las personas en su viaje personal de archivo y preservación digital.

Estos son algunos de los materiales que se pueden digitalizar en el laboratorio:

Documentos
Fotos, diapositivas, negativos
Película Super 8 y 8 mm (sólo imagen, sin audio)
Cintas de audio compactas
CD y DVD
DV y MiniDV (SP)
Disquetes de 3,5 pulgadas
Minidisco
Cinta de audio de bobina a bobina
VHS (SP y EP)
Discos de vinilo (LP y 45)

La Finalidad de estos laboratorios de la memorias son una forma de que las organizaciones conecten personalmente con sus comunidades, salven la historia compartida e impulsen los principios de conservación y acceso.