Voutssas Marquez, Juan. Factores económicos de la preservación documental digital : actualización 2021. Universidad Nacional Autónoma de México. Instituto de Investigaciones Bibliotecológicas, 2022
El enorme incremento de información digital a nivel mundial implica que gran parte de ella debe ser preservada adecuadamente por parte de bibliotecas, archivos, repositorios y otras organizaciones al efecto. La adecuada preservación documental digital –entre otros factores– conlleva costos que no siempre son percibidos integralmente por los directivos de las organizaciones y los responsables de la preservación. A pesar de que a lo largo del tiempo se han elaborado múltiples estudios al respecto, el cambiante entorno tecnológico, el advenimiento de servicios especializados al efecto en la nube, etcétera, han modificado los parámetros para presupuestarla, y por lo mismo requieren que el cálculo de los costos de esta tarea deba ser analizado a la luz de nuevos elementos y contextos emergentes con el fin de revisar el conocimiento al respecto y con ello poder actualizar las técnicas para costeo de la preservación documental digital.
Kahle, Brewster. «Digital Books Wear out Faster than Physical Books». Internet Archive Blogs (blog), 15 de noviembre de 2022.
Ver noticia
¿Ha intentado alguna vez leer un libro físico transmitido en tu familia desde hace 100 años? Probablemente haya funcionado bien. ¿Has intentado leer un libro electrónico que pagaste hace 10 años? Probablemente sea una experiencia diferente. Desde el modelo de negocio de arrendamiento de las megaeditoriales hasta la evolución de los dispositivos físicos y la obsolescencia de los formatos, los libros digitales son frágiles y están amenazados.
Los que nos ocupamos de las bibliotecas de libros digitalizados y nacidos en el mundo digital sabemos que necesitan un mantenimiento constante -reprocesamiento, reformateo, revigorización- o no serán legibles ni se podrán leer. Afortunadamente, esto es lo que hacen las bibliotecas (si no las demandan para que dejen de hacerlo). Las editoriales tratan de introducir nuevas ideas en la esfera pública. Las bibliotecas las adquieren y las mantienen vivas para las generaciones venideras.
Y, para servir a los usuarios con discapacidades de lectura, tenemos que mantenernos al día con las herramientas que utilizan.
Las megaeditoriales dicen que los libros electrónicos no se desgastan, pero esto no es en absoluto cierto. El Internet Archive vprocesa y vuelve a procesar los libros que ha digitalizado a medida que aparecen nuevas tecnologías de reconocimiento óptico de caracteres, cuando las nuevas tecnologías de comprensión de textos abren nuevos análisis, cuando los formatos cambian de djvu a daisy a epub1 a epub2 a epub3 a pdf-a y así sucesivamente. Para ello se necesitan miles de meses de ordenador y años de programaciónr. Esto es lo que las bibliotecas han contratado: sus funciones de custodia a largo plazo.
Además, los soportes digitales en los que residen también cambian: de la cinta digital lineal a los discos duros PATA, a los discos duros SATA y a los SSD. Si no los cuidamos activamente nuestros libros digitales, se vuelven ilegibles muy rápidamente.
Luego está la catalogación y los metadatos. Si no nos mantenemos al día con las expectativas siempre cambiantes de los estudiantes digitales, nuestros libros no se encontrarán. Esto es continuo y costoso.
Nuestros libros en papel han durado cientos de años en nuestras estanterías y siguen siendo legibles. Sin un mantenimiento activo, tendremos suerte si nuestros libros digitales duran una década.
Además, el uso que hacemos de los libros y las publicaciones periódicas, en las décadas posteriores a su publicación, cambia con respecto a su propósito original. Estamos viendo cómo los investigadores utilizan los libros y las publicaciones periódicas en investigaciones de aprendizaje automático para encontrar tendencias que nunca fueron fáciles en un mundo individual, o en los silos de las bases de datos de las editoriales. Preparar estos libros para este tipo de análisis lleva mucho tiempo y ahora está amenazado por las demandas de los editores.
Si queremos tener acceso a nuestro patrimonio digital en el futuro, debemos realizar algunos cambios estructurales: cambios en los comportamientos de las instituciones y los editores, así como en la financiación, las leyes y el cumplimiento de las normas.
El primer paso es reconocer que la preservación y el acceso a nuestro patrimonio digital es una gran tarea que merece la pena realizar. A continuación, hay que encontrar la manera de que las instituciones -educativas, gubernamentales, sin ánimo de lucro y filantrópicas- hagan de la preservación parte de su responsabilidad diaria.
Miguel Ángel Márdero Arellano, Gildenir Carolino Santos. Bibliografia sobre preservação digital: um levantamento nos diversos suportes informacionais. La Plata: Universidad de La Plata, 2021
Esta obra organizada pelos membros do Grupo de Pesquisa «Estudos e Práticas de Preservação Digital» da Rede Cariniana traz à tona, por meio de uma variada coletânea a partir deste volume 1, uma compilação do estado da arte sobre Preservação Digital, arrolada no periodo de 30 anos, no Brasil e no mundo, organizado por vinte e uma (21) áreas temáticas dentro da área central sobre preservação digital, e estruturada pela compilagem de referências e bibliografias nos diversos suportes informacionais (livros, periódicos, sites, CD-ROM, etc.), aprimorando-se como uma fonte de referência para novos e futuros levantamentos bibliográficos a existir sobre o assunto.
Mantener registros en Internet es esencial para entender no sólo la historia de la web, sino también para ayudarnos a rastrear si un tweet fue borrado alguna vez, o si alguien modificó una declaración en una página web.
Los gobiernos también mantienen archivos de las páginas web de cada administración, en aras de la transparencia y el acceso público. El sitio web de la Casa Blanca del ex presidente estadounidense Donald Trump es trumpwhitehouse.archives.gov, mientras que el sitio web de la Casa Blanca de Barack Obama puede encontrarse en obamawhitehouse.archives.gov. Y la administración Clinton creó el primer sitio web de la Casa Blanca en 1994. Estos sitios están etiquetados como «material histórico, «congelado en el tiempo»». Algunos sitios federales son «cosechados» y guardados por el Federal Depository Library Program Web Archive , cuyo objetivo es «proporcionar acceso público permanente al contenido de la web de las agencias federales».
Las estimaciones sobre la vida media de una página web varían con el tiempo. En 1997 Scientific American estimó que era de 44 días, y el New Yorker en 2015 sugirió que podría ser de 100 días. Pero algunas páginas web pueden ser eliminadas en cuestión de horas, especialmente si son de naturaleza políticamente sensible.
En 2014, cuando el vuelo 17 de Malaysia Airlines fue derribado sobre el espacio aéreo ucraniano, un líder separatista ucraniano, Igor Girkin, también conocido como Strelkov, habría escrito: «Acabamos de derribar un avión, un AN-26». Aunque un AN-26 es un avión de carga militar de fabricación soviética, las fotografías del post parecían ser de un Boeing 777. Wayback Machine guardó el post, que fue borrado de la página de Strelkov sólo un par de horas después. Cuando un periodista tuiteó una imagen de la página web guardada escribiendo: «Grab of Donetsk militant Strelkov’s claim of downing what appears to have been MH17», la página de Strelkov había sido editada y la afirmación borrada. La única prueba de ese post era la captura de pantalla guardada en archive.org. Aunque el post podría haber sido engañoso, el incidente puso de manifiesto el papel del Internet Archive en la recopilación de testimonios que resultaron útiles para las investigaciones periodísticas.
Internet Archive (archive.org) está considerado como uno de los mayores archivos de Internet, con unos 625.000 millones de páginas web guardadas desde su fundación en 1996. Su herramienta Wayback Machine permite a los usuarios recorrer 25 años de historia de la web, y la organización se asocia con Federal Depository Library Program Web Archive y otras organizaciones a través de Archive-It.
¿Cómo archivar una página web?
Sin embargo, el sitio más sencillo para empezar es archive.org. Aquí, basta con introducir un enlace en la Wayback Machine para ver si ya existe, haciendo clic en «Browse History». Debajo de eso, otra opción te permite «Guardar la página ahora» y crear un nuevo enlace.
Si quieres navegar por el historial de una página web, serás dirigido a todas las instancias pasadas en las que se ha archivado, organizadas como un calendario, hasta el mes, el día y la hora en que se guardó. Puedes hacer clic en una fecha (indicada por una burbuja azul) para acceder a una página web. Cuanto más grande sea la burbuja, más veces se ha archivado una página en ese día. Hay que tener en cuenta que un enlace verde indica que una página web fue redirigida, y puede no funcionar, por lo que los usuarios deben hacer clic en los enlaces azules.
La parte superior de la página de resultados de la búsqueda también indica a los usuarios cuántas veces se archivó una página web y el intervalo de fechas. La barra superior muestra los años en que se guardaron las páginas, mientras que el calendario que aparece debajo nos permite hacer clic en el mes, el día y la hora.
¿Cómo sabemos que las páginas archivadas no están manipuladas?
Aunque la gente ha hecho capturas de pantalla de páginas web y tweets en el pasado, es más fácil manipular simples imágenes que editar una página web ya archivada.
Además, las capturas de pantalla son estáticas. No se puede interactuar con la página, ni desplazarse, ni pasar el ratón, ni hacer clic en los enlaces, ni siquiera revelar a qué páginas web se refieren los enlaces de la página.
Benner, Jessica G., Erickson, Seth, Hagenmaier, Wendy, Lassere, Monique, Williford, Christa, & Work, Lauren. (2022). Supporting Software Preservation Services in Research and Memory Organizations: A White Paper from the Software Preservation Network’s Research-in-Practice Working Group. Software Preservation Network and Council on Library and Information Resources. https://doi.org/10.5281/zenodo.7272726
Supporting Software Preservation Services in Research and Memory Organizations (Apoyo a los servicios de preservación del software en organizaciones de investigación y memoria) identifica conceptos, conjuntos de habilidades, barreras y direcciones futuras relacionadas con el trabajo de preservación del software. Aunque las definiciones de «software» pueden variar según los contextos de preservación, el estudio revela que parece haber un amplio apoyo a la colaboración interorganizacional en la preservación de software. El informe incluye 13 recomendaciones para ampliar la representación en el campo, definir el campo, crear redes y comunidades, aprender de manera informal y formal, y aplicar infraestructuras compartidas y prácticas modelo.
Library Publishing Coalition (LPC) es una asociación sin ánimo de lucro que trabaja en la extensión, el impacto y la sostenibilidad de la publicación en bibliotecas y de la investigación abierta proporcionando un foro profesional para el desarrollo de las mejores prácticas y la experiencia compartida sobre la publicación académica a través de las bibliotecas.
Library Publishing Coalition acaba de anunciar la publicación de su Informe Anual 2021-2022. Además de describir las finanzas, los activos y los miembros de la LPC, el informe anual destaca varios hitos programáticos, entre ellos:
Los resultados del proyecto de flujos de trabajo de publicación de la biblioteca
Un análisis del panorama realizado por el Grupo de Trabajo de Preservación
El lanzamiento de un proyecto conjunto entre el LPC, la ARL y la AUP para establecer conexiones entre las comunidades editoriales universitarias.
Estas iniciativas, así como la continua sostenibilidad del LPC, son el resultado del trabajo realizado por los miembros del LPC, el personal, nuestros socios y las organizaciones afiliadas. Todas las personas involucradas en este trabajo ofrecieron su tiempo, energía y experiencia para cumplir con nuestra visión de un panorama editorial académico que es abierto, inclusivo y sostenible.
Smithsonian Libraries and Archives han estado trabajando diligentemente durante los últimos 7 años para recopilar información, aprovechar los recursos existentes y demostrar la necesidad de un apoyo holístico para una nueva iniciativa paninstitucional para cuidar y proporcionar acceso a nuestras colecciones de audio, vídeo y películas. a través del programa Audiovisual Media Preservation Initiative (AVMPI).
Esta iniciativa cuenta con el apoyo de expertos de todo el Smithsonian, desde archiveros y conservadores hasta directores y personal de promoción. Actualmente, hay tres equipos estructurados que apoyan y supervisan las actividades de AVMPI.
Al igual que para muchos, la pandemia afectó a nuestro calendario propuesto de un modo que no podíamos imaginar. Aunque nos dio tiempo para reflexionar y tomar decisiones bien calculadas sobre los objetivos, los flujos de trabajo y los recursos desde la seguridad de nuestros hogares, no nos dio tiempo para digitalizar nuestras colecciones in situ. Sin embargo, me alegra decir que 2023 será diferente. He aquí un vistazo a algunos de nuestros planes para el próximo año:
Reimaginar los laboratorios de conservación audiovisual existentes en el Smithsonian. AVMPI está trabajando estrechamente con otras unidades del Smithsonian para dar nueva vida a sus actuales instalaciones de digitalización audiovisual. Ya sea añadiendo equipos, realizando tareas de mantenimiento o revisando la configuración de los bastidores (o una combinación de todo ello), tenemos previsto ubicar a nuestros nuevos especialistas en conservación en estos lugares para que comiencen a digitalizar las colecciones.
Ejecución de proyectos financiados con subvenciones. AVMPI ha recibido financiación de la Iniciativa de Historia de las Mujeres Americanas para apoyar la digitalización y los servicios de subtitulación de colecciones de audio, vídeo y cine extraordinarias y únicas de seis unidades del Smithsonian. El proyecto, titulado Witnessing Working Women: Digitalización de las grabaciones audiovisuales de fuentes primarias de la IS, desbloqueará las colecciones audiovisuales institucionales que relatan las historias de las mujeres dentro de la fuerza de trabajo estadounidense.
Desarrollar flujos de trabajo innovadores y ágiles. Estandarizar los flujos de trabajo digitales y físicos en todo el Smithsonian no será una tarea fácil. Aunque todas las unidades comparten algunos de los mismos sistemas, como nuestro sistema de gestión de activos digitales (DAMS), cada unidad también tiene su propia manera de catalogar, tratar y proporcionar acceso a sus activos audiovisuales. AVMPI tratará de crear nuevos flujos de trabajo cohesionados que se apoyen en los sistemas y recursos existentes.
Aumentar la accesibilidad de los medios audiovisuales y de los contenidos en streaming del Smithsonian. AVMPI pondrá en primer plano las «mejores prácticas» en materia de accesibilidad para los activos audiovisuales digitales a través de una filosofía de «predicar con el ejemplo». Daremos prioridad al subtitulado, la transcripción y la descripción de audio para llegar a nuestro público con discapacidades auditivas y visuales, y trabajaremos para desarrollar directrices claras para cumplir con las normas de accesibilidad exigidas por el Consorcio de la World Wide Web (W3C).
Crear auténticas oportunidades de participación que pongan de relieve las colecciones audiovisuales paninstitucionales del SI. Las colecciones de audio, vídeo y cine del Smithsonian representan la diversidad de nuestro mundo. Sin embargo, las conexiones significativas que existen entre las colecciones de nuestras unidades individuales no se han explorado completamente. En el próximo año, AVMPI no sólo aumentará el acceso en línea a las colecciones digitalizadas, sino que creará exposiciones en línea que exploren estas relaciones. Además, esperamos acoger o participar en varias proyecciones y recepciones en persona que llegarán a nuevos públicos. Esté atento a los detalles.
Aumento de la plantilla. Tenemos previsto contratar a cuatro miembros más del equipo para apoyar nuestros objetivos: un especialista en conservación de audio, un especialista en conservación de vídeo y dos especialistas en colecciones multimedia.
The University of Chicago Library: Preservation Labs
The University of Chicago Library: Preservation Labs.
Library Preservation Laboratories de la Biblioteca Universitaria de Chicago son el lugar donde el arte se une a la ciencia y donde las colecciones se transforman. Reflejando tanto el arte de las prácticas tradicionales como el ingenio de la innovación moderna, los conservadores y especialistas en digitalización crean múltiples vías para que los recursos académicos y prolonguen su longevidad. El breve documental explora la ciencia y el oficio de la conservación y cómo los equipo de expertos rescatan un antifonario del siglo XVI. También cómo los especialistas en conservación convierten lo físico en formatos digitales, ayudando a la biblioteca a compartir las colecciones para una profunda exploración en Chicago y en todo el mundo.
La capacidad de la biblioteca para preservar sus ricas colecciones se amplía considerablemente en este espacio de 6.000 pies cuadrados, que incluye laboratorios de conservación y digitalización. Juntos, permiten a la biblioteca conservar las colecciones para las generaciones futuras, a la vez que proporcionan acceso mundial a las colecciones digitalizadas en línea. Ambos laboratorios dan servicio a todas las bibliotecas del campus, manejando materiales tanto de las colecciones generales como de las especiales.
Laboratorio de conservación
Conservation Laboratory se utiliza para proporcionar una amplia gama de tratamientos físicos que ayudan a preservar los materiales en sus formatos originales. Los tratamientos van desde la simple reparación del papel hasta la reencuadernación completa de un libro.
Junto con el equipo tradicional de encuadernación de libros, se utiliza un fregadero especializado en el lavado de papel y una campana extractora para los tratamientos químicos con el fin de conservar los objetos originales. La ampliación del espacio de conservación de Mansueto y los nuevos equipos permiten realizar tratamientos más sofisticados de los objetos in situ de lo que era posible anteriormente en la biblioteca.
Laboratorio de digitalización
En el Digitization Laboratory, el personal de la Biblioteca convierte muchos tipos de materiales en papel a formatos digitales más estables y utilizables. Los materiales originales van desde libros impresos y manuscritos hasta fotografías, mapas y colecciones de archivo.
El equipo incluye un escáner de transparencias Zeutschel capaz de digitalizar tanto material encuadernado como plano en posición boca arriba. Los escáneres planos se utilizan para capturar fotografías, manuscritos y otros elementos planos. Una cámara digital de gran formato permite escanear objetos frágiles y de gran tamaño.
Moore, Jennifer, Rountrey, Adam ; Kettler, Hannah Scates (coord.) 3D Data Preservation, Print and OA Editions Available. Association of College and Research Libraries, 2022
La directora de los servicios de datos de las bibliotecas universitarias, Jennifer Moore, es la coeditora de un libro recientemente publicado sobre la conservación y gestión de datos en 3D. 3D Data Creation to Curation: Community Standards for 3D Data Preservation (CS3DP) ha sido publicado por la Association of College and Research Libraries y está disponible en edición impresa y electrónica de acceso abierto.
El libro se desarrolló a partir de un premio del Programa National Leadership Grants for Libraries Program de IMLS para un proyecto de colaboración entre las Bibliotecas de la Universidad de Washington, las Bibliotecas de la Universidad de Iowa y el Museo de Paleontología de la Universidad de Michigan.
El libro es un recurso fundamental para todos los usuarios nuevos y experimentados de datos 3D en instituciones, la industria y las disciplinas académicas, así como para aquellos «que no participan en la creación de datos pero que tienen la tarea de conservar, migrar y mantener el acceso a estos datos a largo plazo» (American Library Association). Contiene siete capítulos de treinta y cinco colaboradores que representan una amplia variedad de instituciones académicas. CS3DP surgió de foros, debates y encuestas en la comunidad interdisciplinaria de datos 3D.
El libro recomienda normas y mejores prácticas para preservar los datos 3D a través de un debate sobre varios temas distintos e interconectados: metadatos y documentación, almacenamiento y gestión de repositorios a largo plazo, articulación de derechos y propiedad, y restricciones y acceso.
Nuestro patrimonio cultural, histórico y científico se produce y comparte cada vez más en formato digital, ya sea de origen digital o reformulado a partir de materiales físicos. Existen fundamentalmente dos tipos de enfoques diferentes para la preservación: El primero es la preservación programática, que consiste en una serie de esfuerzos interinstitucionales para conservar y preservar determinados tipos de contenidos o colecciones, generalmente basados en la creación de depósitos de confianza. Algunos ejemplos de proveedores de esta categoría que ofrecen preservación programática son CLOCKSS, Internet Archive, HathiTrust y Portico. Además, existen plataformas de preservación de terceros, que son utilizadas por organizaciones individuales del patrimonio que emprenden sus propios esfuerzos discretos para proporcionar curación, descubrimiento y gestión a largo plazo de sus contenidos y colecciones digitales institucionales.