Archivo de la etiqueta: Preservación digital

¿Podemos hacer más? Un examen de las posibles funciones, contribuyentes, incentivos y marcos para sostener la conservación digital a gran escala

Carol A. Mandel. Can We Do More? An Examination of Potential Roles, Contributors, Incentives, and Frameworks to Sustain Large-Scale Digital Preservation. CLIR, 2019

Texto completo

Los numerosos retos que plantea la gestión y conservación de contenidos digitales son bien conocidos por las instituciones de memoria cultural. Las instituciones se han convertido en expertas en digitalizar y reformatear contenidos importantes y garantizar su acceso a largo plazo. Al mismo tiempo, la naturaleza, la escala y las complejidades políticas de los contenidos que nacen digitales están planteando un cambio aún más radical en las exigencias y expectativas. Una cantidad abrumadora de los conocimientos, las pruebas documentales y la expresión creativa que se producen hoy en día tienen su origen en formatos digitales, desde informes de noticias a medios de comunicación o documentos personales. Aunque han surgido importantes iniciativas para mantener accesibles determinados contenidos nacidos en formato digital, en comparación con las políticas de recopilación de la era analógica, sólo estamos preservando una pequeña parte de lo que existe. ¿Es suficiente?

Carol Mandel, becaria presidencial del CLIR, investiga esta cuestión en un estudio de los marcos sociales e institucionales que recogen y conservan pruebas documentales de origen digital. La investigadora concluye que, aunque seguimos avanzando a pasos agigantados en el cumplimiento de las enormes exigencias técnicas que plantea la conservación de materiales digitales, nuestra capacidad -y el ímpetu- para recopilar contenidos de origen digital va muy a la zaga de las probables necesidades futuras de documentación del mundo actual. La decisión de recopilar es un requisito previo esencial para la conservación y el acceso duradero.

La tarea de preservación y conservación digital de los bibliotecarios y archiveros del siglo XXI

A medida que entramos en la era electrónica de objetos digitales, es importante saber que hay nuevos bárbaros en la frontera y que estamos entrando en una época donde mucho de lo que sabemos hoy, mucho de lo que está codificado y escrito electrónicamente, se perderá para siempre. Estamos, en mi opinión, viviendo en medio de la edad media digital. En consecuencia, igual que los monjes del pasado, le toca a bibliotecarios y archiveros hacerse cargo de la tradición de conservar la historia y el patrimonio documental de nuestros tiempo.

Terry Kuny

KUNY, Terry, The digital dark ages? Challenges in the preservation of electronic information. International Preservation News, 1998, no. 17, (en línea).
http://www.ifla.org/VI/4/news/17-98.htm#2

Tomado de Preservación y conservación de documentos digitales de José Manuel Barrueco

Internet Archive pone a disposición más de 50.000 emisiones de radioaficionados de todos los tiempos

Kaysavetz. «Archive for Amateur Radio Grows to 51,000 Items». Internet Archive Blogs (blog), 24 de enero de 2023. https://blog.archive.org/2023/01/24/archive-for-amateur-radio-grows-to-51000-items/.

 Digitial Library of Amateur Radio & Communications de Internet Archive está creciendo rápidamente para convertirse en un importante archivo del pasado y presente de la radio. La colección ha crecido hasta superar los 51.000 artículos relacionados con la radioafición, la escucha de onda corta, los escáneres y las comunicaciones afines. Las últimas incorporaciones incluyen libros, periódicos y revistas, boletines y archivos de las primeras listas de discusión de Internet.

Más de 3.300 libros y revistas están ahora disponibles mediante préstamo digital controlado en la biblioteca de préstamo del DLARC. Estos materiales, entre los que se incluyen cientos de números de revistas y periódicos como Popular ElectronicsRF Design y General Radio Experimenter,, pueden ser prestados para su lectura en línea o fuera de línea, un lector a la vez, por cualquier persona con una cuenta gratuita de Internet Archive. El DLARC también ha añadido las revistas de radioaficionados  QST de 1912-1961, Radio & Television News de 1919-1959 y Radio magazine de 1920-1947.

Casi 1.300 episodios de The RAIN Report, un programa de audio que emitió noticias y entrevistas relevantes para la comunidad de radioaficionados desde 1985 hasta 2019, están ahora disponibles, incluyendo cientos de episodios perdidos, gracias a la ayuda del productor del programa, Hap Holly. DLARC también ha añadido la biblioteca de 700 episodios del National Radio Club DX Audio Service, que informaba sobre noticias relacionadas con la radio desde 1985 hasta 2015.

Factores económicos de la preservación documental digital

Voutssas Marquez, Juan. Factores económicos de la preservación documental digital : actualización 2021. Universidad Nacional Autónoma de México. Instituto de Investigaciones Bibliotecológicas, 2022

Texto completo

El enorme incremento de información digital a nivel mundial implica que gran parte de ella debe ser preservada adecuadamente por parte de bibliotecas, archivos, repositorios y otras organizaciones al efecto. La adecuada preservación documental digital –entre otros factores– conlleva costos que no siempre son percibidos integralmente por los directivos de las organizaciones y los responsables de la preservación. A pesar de que a lo largo del tiempo se han elaborado múltiples estudios al respecto, el cambiante entorno tecnológico, el advenimiento de servicios especializados al efecto en la nube, etcétera, han modificado los parámetros para presupuestarla, y por lo mismo requieren que el cálculo de los costos de esta tarea deba ser analizado a la luz de nuevos elementos y contextos emergentes con el fin de revisar el conocimiento al respecto y con ello poder actualizar las técnicas para costeo de la preservación documental digital.

Los libros digitales se desgastan más rápido que los físicos

Kahle, Brewster. «Digital Books Wear out Faster than Physical Books». Internet Archive Blogs (blog), 15 de noviembre de 2022.

Ver noticia

¿Ha intentado alguna vez leer un libro físico transmitido en tu familia desde hace 100 años? Probablemente haya funcionado bien. ¿Has intentado leer un libro electrónico que pagaste hace 10 años? Probablemente sea una experiencia diferente. Desde el modelo de negocio de arrendamiento de las megaeditoriales hasta la evolución de los dispositivos físicos y la obsolescencia de los formatos, los libros digitales son frágiles y están amenazados.

Los que nos ocupamos de las bibliotecas de libros digitalizados y nacidos en el mundo digital sabemos que necesitan un mantenimiento constante -reprocesamiento, reformateo, revigorización- o no serán legibles ni se podrán leer. Afortunadamente, esto es lo que hacen las bibliotecas (si no las demandan para que dejen de hacerlo). Las editoriales tratan de introducir nuevas ideas en la esfera pública. Las bibliotecas las adquieren y las mantienen vivas para las generaciones venideras.

Y, para servir a los usuarios con discapacidades de lectura, tenemos que mantenernos al día con las herramientas que utilizan.

Las megaeditoriales dicen que los libros electrónicos no se desgastan, pero esto no es en absoluto cierto. El Internet Archive vprocesa y vuelve a procesar los libros que ha digitalizado a medida que aparecen nuevas tecnologías de reconocimiento óptico de caracteres, cuando las nuevas tecnologías de comprensión de textos abren nuevos análisis, cuando los formatos cambian de djvu a daisy a epub1 a epub2 a epub3 a pdf-a y así sucesivamente. Para ello se necesitan miles de meses de ordenador y años de programaciónr. Esto es lo que las bibliotecas han contratado: sus funciones de custodia a largo plazo.

Además, los soportes digitales en los que residen también cambian: de la cinta digital lineal a los discos duros PATA, a los discos duros SATA y a los SSD. Si no los cuidamos activamente nuestros libros digitales, se vuelven ilegibles muy rápidamente.

Luego está la catalogación y los metadatos. Si no nos mantenemos al día con las expectativas siempre cambiantes de los estudiantes digitales, nuestros libros no se encontrarán. Esto es continuo y costoso.

Nuestros libros en papel han durado cientos de años en nuestras estanterías y siguen siendo legibles. Sin un mantenimiento activo, tendremos suerte si nuestros libros digitales duran una década.

Además, el uso que hacemos de los libros y las publicaciones periódicas, en las décadas posteriores a su publicación, cambia con respecto a su propósito original. Estamos viendo cómo los investigadores utilizan los libros y las publicaciones periódicas en investigaciones de aprendizaje automático para encontrar tendencias que nunca fueron fáciles en un mundo individual, o en los silos de las bases de datos de las editoriales. Preparar estos libros para este tipo de análisis lleva mucho tiempo y ahora está amenazado por las demandas de los editores.

Si queremos tener acceso a nuestro patrimonio digital en el futuro, debemos realizar algunos cambios estructurales: cambios en los comportamientos de las instituciones y los editores, así como en la financiación, las leyes y el cumplimiento de las normas.

El primer paso es reconocer que la preservación y el acceso a nuestro patrimonio digital es una gran tarea que merece la pena realizar. A continuación, hay que encontrar la manera de que las instituciones -educativas, gubernamentales, sin ánimo de lucro y filantrópicas- hagan de la preservación parte de su responsabilidad diaria.

Bibliografía sobre preservación digital: un estudio sobre diferentes soportes de información.

Miguel Ángel Márdero Arellano, Gildenir Carolino Santos. Bibliografia sobre preservação digital: um levantamento nos diversos suportes informacionais. La Plata: Universidad de La Plata, 2021

Texto completo

Esta obra organizada pelos membros do Grupo de Pesquisa «Estudos e Práticas de Preservação Digital» da Rede Cariniana traz à tona, por meio de uma variada coletânea a partir deste volume 1, uma compilação do estado da arte sobre Preservação Digital, arrolada no periodo de 30 anos, no Brasil e no mundo, organizado por vinte e uma (21) áreas temáticas dentro da área central sobre preservação digital, e estruturada pela compilagem de referências e bibliografias nos diversos suportes informacionais (livros, periódicos, sites, CD-ROM, etc.), aprimorando-se como uma fonte de referência para novos e futuros levantamentos bibliográficos a existir sobre o assunto.

Una guía para archivar en Internet y por qué tener registros es esencial para los verificadores de hechos.

Ibrahim, Nur. «A Guide to Archiving on the Internet». Snopes, 12 de noviembre de 2022. https://www.snopes.com/articles/463946/articlesnewarchiving-on-the-internet/.

Mantener registros en Internet es esencial para entender no sólo la historia de la web, sino también para ayudarnos a rastrear si un tweet fue borrado alguna vez, o si alguien modificó una declaración en una página web.

Los gobiernos también mantienen archivos de las páginas web de cada administración, en aras de la transparencia y el acceso público. El sitio web de la Casa Blanca del ex presidente estadounidense Donald Trump es trumpwhitehouse.archives.gov, mientras que el sitio web de la Casa Blanca de Barack Obama puede encontrarse en obamawhitehouse.archives.gov. Y la administración Clinton creó el primer sitio web de la Casa Blanca en 1994. Estos sitios están etiquetados como «material histórico, «congelado en el tiempo»». Algunos sitios federales son «cosechados» y guardados por el Federal Depository Library Program Web Archive , cuyo objetivo es «proporcionar acceso público permanente al contenido de la web de las agencias federales».

Las estimaciones sobre la vida media de una página web varían con el tiempo. En 1997  Scientific American estimó que era de 44 días, y el New Yorker en 2015 sugirió que podría ser de 100 días. Pero algunas páginas web pueden ser eliminadas en cuestión de horas, especialmente si son de naturaleza políticamente sensible.

En 2014, cuando el vuelo 17 de Malaysia Airlines fue derribado sobre el espacio aéreo ucraniano, un líder separatista ucraniano, Igor Girkin, también conocido como Strelkov, habría escrito: «Acabamos de derribar un avión, un AN-26». Aunque un AN-26 es un avión de carga militar de fabricación soviética, las fotografías del post parecían ser de un Boeing 777. Wayback Machine guardó el post, que fue borrado de la página de Strelkov sólo un par de horas después. Cuando un periodista tuiteó una imagen de la página web guardada escribiendo: «Grab of Donetsk militant Strelkov’s claim of downing what appears to have been MH17», la página de Strelkov había sido editada y la afirmación borrada. La única prueba de ese post era la captura de pantalla guardada en archive.org. Aunque el post podría haber sido engañoso, el incidente puso de manifiesto el papel del Internet Archive en la recopilación de testimonios que resultaron útiles para las investigaciones periodísticas.

Internet Archive (archive.org) está considerado como uno de los mayores archivos de Internet, con unos 625.000 millones de páginas web guardadas desde su fundación en 1996. Su herramienta Wayback Machine permite a los usuarios recorrer 25 años de historia de la web, y la organización se asocia con Federal Depository Library Program Web Archive y otras organizaciones a través de  Archive-It.

¿Cómo archivar una página web?

Sin embargo, el sitio más sencillo para empezar es archive.org. Aquí, basta con introducir un enlace en la Wayback Machine para ver si ya existe, haciendo clic en «Browse History». Debajo de eso, otra opción te permite «Guardar la página ahora» y crear un nuevo enlace.

Si quieres navegar por el historial de una página web, serás dirigido a todas las instancias pasadas en las que se ha archivado, organizadas como un calendario, hasta el mes, el día y la hora en que se guardó. Puedes hacer clic en una fecha (indicada por una burbuja azul) para acceder a una página web. Cuanto más grande sea la burbuja, más veces se ha archivado una página en ese día. Hay que tener en cuenta que un enlace verde indica que una página web fue redirigida, y puede no funcionar, por lo que los usuarios deben hacer clic en los enlaces azules.

La parte superior de la página de resultados de la búsqueda también indica a los usuarios cuántas veces se archivó una página web y el intervalo de fechas. La barra superior muestra los años en que se guardaron las páginas, mientras que el calendario que aparece debajo nos permite hacer clic en el mes, el día y la hora.

¿Cómo sabemos que las páginas archivadas no están manipuladas?

Aunque la gente ha hecho capturas de pantalla de páginas web y tweets en el pasado, es más fácil manipular simples imágenes que editar una página web ya archivada.

Además, las capturas de pantalla son estáticas. No se puede interactuar con la página, ni desplazarse, ni pasar el ratón, ni hacer clic en los enlaces, ni siquiera revelar a qué páginas web se refieren los enlaces de la página.

Apoyo a los servicios de preservación del software en organizaciones de investigación y memoria: Libro Blanco

Benner, Jessica G., Erickson, Seth, Hagenmaier, Wendy, Lassere, Monique, Williford, Christa, & Work, Lauren. (2022). Supporting Software Preservation Services in Research and Memory Organizations: A White Paper from the Software Preservation Network’s Research-in-Practice Working Group. Software Preservation Network and Council on Library and Information Resources. https://doi.org/10.5281/zenodo.7272726

Texto completo

Supporting Software Preservation Services in Research and Memory Organizations (Apoyo a los servicios de preservación del software en organizaciones de investigación y memoria) identifica conceptos, conjuntos de habilidades, barreras y direcciones futuras relacionadas con el trabajo de preservación del software. Aunque las definiciones de «software» pueden variar según los contextos de preservación, el estudio revela que parece haber un amplio apoyo a la colaboración interorganizacional en la preservación de software. El informe incluye 13 recomendaciones para ampliar la representación en el campo, definir el campo, crear redes y comunidades, aprender de manera informal y formal, y aplicar infraestructuras compartidas y prácticas modelo.

Informe anual de Library Publishing Coalition

2021-2022 Annual Report. The Library Publishing Coalition, 2022

Texto completo

Library Publishing Coalition (LPC) es una asociación sin ánimo de lucro que trabaja en la extensión, el impacto y la sostenibilidad de la publicación en bibliotecas y de la investigación abierta proporcionando un foro profesional para el desarrollo de las mejores prácticas y la experiencia compartida sobre la publicación académica a través de las bibliotecas.

Library Publishing Coalition acaba de anunciar la publicación de su Informe Anual 2021-2022. Además de describir las finanzas, los activos y los miembros de la LPC, el informe anual destaca varios hitos programáticos, entre ellos:

  • Los resultados del proyecto de flujos de trabajo de publicación de la biblioteca
  • Un análisis del panorama realizado por el Grupo de Trabajo de Preservación
  • El lanzamiento de un proyecto conjunto entre el LPC, la ARL y la AUP para establecer conexiones entre las comunidades editoriales universitarias.

Estas iniciativas, así como la continua sostenibilidad del LPC, son el resultado del trabajo realizado por los miembros del LPC, el personal, nuestros socios y las organizaciones afiliadas. Todas las personas involucradas en este trabajo ofrecieron su tiempo, energía y experiencia para cumplir con nuestra visión de un panorama editorial académico que es abierto, inclusivo y sostenible.

Porgrama de Preservación de Medios Audiovisuales de Smithsonian Libraries and Archives (AVMPI)

 The Audiovisual Media Preservation Initiative (AVMPI)

Smithsonian Libraries and Archives han estado trabajando diligentemente durante los últimos 7 años para recopilar información, aprovechar los recursos existentes y demostrar la necesidad de un apoyo holístico para una nueva iniciativa paninstitucional para cuidar y proporcionar acceso a nuestras colecciones de audio, vídeo y películas. a través del programa Audiovisual Media Preservation Initiative (AVMPI).

Esta iniciativa cuenta con el apoyo de expertos de todo el Smithsonian, desde archiveros y conservadores hasta directores y personal de promoción. Actualmente, hay tres equipos estructurados que apoyan y supervisan las actividades de AVMPI.

Al igual que para muchos, la pandemia afectó a nuestro calendario propuesto de un modo que no podíamos imaginar. Aunque nos dio tiempo para reflexionar y tomar decisiones bien calculadas sobre los objetivos, los flujos de trabajo y los recursos desde la seguridad de nuestros hogares, no nos dio tiempo para digitalizar nuestras colecciones in situ. Sin embargo, me alegra decir que 2023 será diferente. He aquí un vistazo a algunos de nuestros planes para el próximo año:

Reimaginar los laboratorios de conservación audiovisual existentes en el Smithsonian. AVMPI está trabajando estrechamente con otras unidades del Smithsonian para dar nueva vida a sus actuales instalaciones de digitalización audiovisual. Ya sea añadiendo equipos, realizando tareas de mantenimiento o revisando la configuración de los bastidores (o una combinación de todo ello), tenemos previsto ubicar a nuestros nuevos especialistas en conservación en estos lugares para que comiencen a digitalizar las colecciones.

Ejecución de proyectos financiados con subvenciones. AVMPI ha recibido financiación de la Iniciativa de Historia de las Mujeres Americanas para apoyar la digitalización y los servicios de subtitulación de colecciones de audio, vídeo y cine extraordinarias y únicas de seis unidades del Smithsonian. El proyecto, titulado Witnessing Working Women: Digitalización de las grabaciones audiovisuales de fuentes primarias de la IS, desbloqueará las colecciones audiovisuales institucionales que relatan las historias de las mujeres dentro de la fuerza de trabajo estadounidense.

Desarrollar flujos de trabajo innovadores y ágiles. Estandarizar los flujos de trabajo digitales y físicos en todo el Smithsonian no será una tarea fácil. Aunque todas las unidades comparten algunos de los mismos sistemas, como nuestro sistema de gestión de activos digitales (DAMS), cada unidad también tiene su propia manera de catalogar, tratar y proporcionar acceso a sus activos audiovisuales. AVMPI tratará de crear nuevos flujos de trabajo cohesionados que se apoyen en los sistemas y recursos existentes.

Aumentar la accesibilidad de los medios audiovisuales y de los contenidos en streaming del Smithsonian. AVMPI pondrá en primer plano las «mejores prácticas» en materia de accesibilidad para los activos audiovisuales digitales a través de una filosofía de «predicar con el ejemplo». Daremos prioridad al subtitulado, la transcripción y la descripción de audio para llegar a nuestro público con discapacidades auditivas y visuales, y trabajaremos para desarrollar directrices claras para cumplir con las normas de accesibilidad exigidas por el Consorcio de la World Wide Web (W3C).

Crear auténticas oportunidades de participación que pongan de relieve las colecciones audiovisuales paninstitucionales del SI. Las colecciones de audio, vídeo y cine del Smithsonian representan la diversidad de nuestro mundo. Sin embargo, las conexiones significativas que existen entre las colecciones de nuestras unidades individuales no se han explorado completamente. En el próximo año, AVMPI no sólo aumentará el acceso en línea a las colecciones digitalizadas, sino que creará exposiciones en línea que exploren estas relaciones. Además, esperamos acoger o participar en varias proyecciones y recepciones en persona que llegarán a nuevos públicos. Esté atento a los detalles.

Aumento de la plantilla. Tenemos previsto contratar a cuatro miembros más del equipo para apoyar nuestros objetivos: un especialista en conservación de audio, un especialista en conservación de vídeo y dos especialistas en colecciones multimedia.