Archivo de la etiqueta: Preservación digital

Cada día desaparecen partes de la web. Cómo salvar la historia de Internet

Parts of the web are disappearing every day. Here’s how to save Internet history. By Kayla Harris and Christina Beis and Stephanie Shreffler. Fast Company, August 2021

Ver noticia completa

Este año Internet Archive cumple 25 años. Es más conocido por su papel pionero en el archivo de Internet a través de la Wayback Machine, que permite a los usuarios ver cómo eran los sitios web en el pasado.

Cada vez más, gran parte de la vida cotidiana se desarrolla en línea. La escuela, el trabajo, la comunicación con los amigos y la familia, así como las noticias y las imágenes, son accesibles a través de una variedad de sitios web. La información que antes se imprimía, se enviaba físicamente por correo o se guardaba en álbumes de fotos y cuadernos puede estar ahora disponible sólo en línea. La pandemia de COVID-19 ha empujado aún más interacciones a la web.

Es posible que aunque no nos demos hay partes de Internet que desaparecen constantemente. Como bibliotecarios y archiveros, reforzamos la memoria colectiva preservando los materiales que documentan el patrimonio cultural de la sociedad, incluso en la web. Tú también puedes ayudarnos a salvar Internet como ciudadano archivero.

La gente y las organizaciones eliminan contenidos de la web por diversas razones. A veces es el resultado de los cambios en la cultura de Internet, como el reciente cierre de Yahoo Respuestas. Cuando se actualiza un sitio web, por ejemplo, se sobrescribe la versión anterior, a menos que se haya archivado.

El archivo web es el proceso de recopilación, conservación y acceso continuo a la información en Internet. A menudo, este trabajo lo realizan bibliotecarios y archiveros, con la ayuda de tecnología automatizada como los rastreadores web. Los rastreadores web son programas que indexan las páginas web para ponerlas a disposición de los motores de búsqueda o para su conservación a largo plazo. Internet Archive, una organización sin ánimo de lucro, utiliza miles de servidores informáticos para guardar múltiples copias digitales de estas páginas, lo que requiere más de 70 petabytes de datos.

Archivar los sitios web del gobierno promueve la transparencia y la responsabilidad. Especialmente en tiempos de transición, los sitios web del gobierno son vulnerables a la eliminación con los cambios de los partidos políticos. Además, los sitios web archivados documentan la cultura y la historia de Internet, como la Galería Geocities, no sólo son divertidos de ver, sino que también ilustran las formas en que los primeros sitios web fueron creados y utilizados por los individuos.

Archivar Internet es una tarea monumental, que los bibliotecarios y archiveros no pueden hacer solos. Cualquiera puede ser un archivero ciudadano y preservar la historia a través de la Wayback Machine de Internet Archive. La función “Guardar página ahora” permite a cualquiera archivar libremente una sola página de un sitio web público. Hay que tener en cuenta que algunos sitios web impiden el rastreo y el archivado mediante una codificación especial o exigiendo un inicio de sesión en el sitio. Esto puede deberse a un contenido sensible o a la preferencia personal del desarrollador de la web.

Las instituciones del patrimonio cultural local, como bibliotecas, archivos y museos, también archivan activamente en Internet. Más de 800 instituciones utilizan Archive-It, una herramienta del Archivo de Internet, para crear colecciones web archivada. También el programa  Community Webs, en colaboración con Institute of Museum and Library Services, ayuda a las bibliotecas públicas a crear colecciones de contenidos web archivados relevantes para las comunidades locales.

Los sitios web de hoy son la prueba histórica de mañana, pero sólo si se archivan. Si se pierden, perderemos información crucial sobre las decisiones de las empresas y los gobiernos, los métodos de comunicación modernos, como las redes sociales, y los movimientos sociales con una importante presencia en línea, como Black Lives Matter y #MeToo.

La plataforma de software libre FOLIO permitirá el intercambio de recursos y el desarrollo de préstamos digitales controlados

Ver noticia

EBSCO Information Services (EBSCO) está aumentando su compromiso de desarrollo con los préstamos digitales controlados (CDL) y el intercambio de recursos en la plataforma de servicios bibliotecarios FOLIO (LSP). En colaboración con Knowledge Integration (K-Int), EBSCO promoverá el desarrollo de estas soluciones para bibliotecas de todo el mundo.

Se trata de una oferta esencial de código abierto para el préstamo y la circulación de materiales digitalizados, incluida la gestión de licencias y derechos digitales. Al concentrar los recursos de desarrollo en préstamos digitales controlados, EBSCO y K-Int podrán proporcionar un ciclo de desarrollo acelerado y ofrecer préstamos digitales controlados para bibliotecas a nivel internacional. El trabajo sobre préstamos digitales controlados comenzará de inmediato con la entrega prevista para el tercer trimestre de 2022.

El Consejo Internacional de Archivos (ICA) presenta el programa de conservación de registros digitales

Introducing the Digital Records Curation Programme. ICA, 2021

Ver noticia

El DRCP [Digital Records Curation Programme] es un conjunto de materiales didácticos que abarcan la cultura digital y la sociedad de la información, la autenticidad y fiabilidad de los documentos de archivo digitales e híbridos, los metadatos, la elaboración de perfiles de archivos, la computación en la nube, la gestión del correo electrónico, la conservación digital, la seguridad de la información, los depósitos digitales y la valoración de los documentos de archivo digitales, la digitalización, la descripción y la indización, el archivo en la web y en los medios sociales y la gestión de datos.

Los materiales del DRCP comprenden:

  • Una guía, que introduce la estructura y la terminología del material
  • un manual del curso (syllabus) que incluye lecturas y recursos para los estudiantes
    para cada clase o taller, un plan de clases con actividades, y un conjunto de diapositivas de presentación, que incluye notas para los instructores.
  • El contenido se ha creado para entornos con pocos recursos: hemos tratado de no hacer suposiciones sobre el acceso a Internet, los equipos de alta tecnología o los programas informáticos patentados, y en su lugar los materiales sugieren una serie de opciones para enseñar sobre la preservación digital con limitaciones de recursos. Las listas de lectura también se centran en los materiales de libre acceso.

Estado de la conservación y preservación de las noticias digitales

Endangered But Not Too Late: The State of Digital News Preservation. University of Missouri Libraries, 2021

Texto completo

Los resultados de una investigación de 18 meses de duración para descubrir cómo las organizaciones de noticias de EE.UU. y Europa están preservando las noticias digitales y para identificar las mejores prácticas, las áreas problemáticas y los cambios necesarios para evitar la pérdida involuntaria de contenido se han publicado hoy en el informe Endangered but Not Too Late: The State of Digital News Preservation.

Al frente de un grupo de investigadores de la Universidad de Missouri y expertos del sector en este proyecto, Edward McCain, conservador digital de periodismo de las bibliotecas de la Universidad de Missouri y del Instituto de Periodismo Donald W. Reynolds, y su equipo entrevistaron a 115 personas de 29 organizaciones de noticias, cuatro empresas de tecnología de noticias, dos agregadores de noticias y cinco instituciones de memoria, profundizando en la tecnología utilizada por estas organizaciones para comprender mejor cómo se puede preservar el contenido de las noticias digitales.

Lo que se desprende de esta investigación es que la expectativa típica de los lectores y el público, de que la preservación de las noticias es automática en la era digital, simplemente no es correcta. De hecho, lo más probable es que, a menos que las organizaciones de noticias hagan algo específico e intencionado para preservarlas, una parte o la totalidad de sus contenidos nacidos en formato digital desaparezcan en pocos años. Ya no será accesible, legible, consultable o recuperable a menos que se tomen medidas deliberadas para garantizarlo.

Este bibliotecario de Internet tiene la misión de archivar la web antes de que la borren

MarkMark Graham director de Wayback Machine

Mark Graham teme que partes valiosas de la historia de la humanidad estén desapareciendo ante nuestros ojos. Como director de Wayback Machine, un sitio web que registra cómo han cambiado las páginas web individuales a lo largo del tiempo, es muy consciente de lo importante que es mantener un registro de lo que se publica, y dónde.

“Si queremos que las generaciones futuras tengan la oportunidad de aprender de la historia, es imprescindible que ésta esté a su disposición”, afirma Graham. “En las últimas décadas, casi toda la comunicación del conocimiento humano ha sido digital y, aunque eso ha permitido un aumento espectacular del volumen y la frecuencia, también ha traído consigo su fragilidad”.

Mark Graham director de Wayback Machine

La Wayback Machine es un archivo digital de la World Wide Web, fundado por el Internet Archive, una biblioteca sin ánimo de lucro con sede en San Francisco. Permite al usuario “retroceder en el tiempo” y ver cómo eran los sitios web en el pasado, para ello vas:

  • Abres el sitio web de Wayback.
  • Introduces la URL del sitio o página web desaparecida que quieres abrir en la casilla de la parte superior.
  • Haz clic en Examinar el historial.
  • Verás una vista de calendario. Selecciona el año en la parte superior y luego la fecha de la lista de meses en la parte inferior.
  • Ya está.

Aunque no hay garantía de que una página perdida haya sido archivada, Internet Archive señala que Wayback Machine tiene archivadas más de 900.000 millones de URL y más de 400.000 millones de páginas web en sus 23 años de historia.

Si quieres ver un vídeo borrado de YouTube utilizando Wayback Machine, puedes encontrar el enlace al vídeo al que quieres acceder, sin la URL no podrás acceder al vídeo borrado de YouTube. … No podrás reproducir el vídeo directamente, aunque si puedes descargarlo.

Hay una serie de herramientas útiles que pueden hacer que la Wayback Machine forme parte de tu experiencia diaria en Internet. Si quieres evitar encontrarte con errores de páginas web 404 en el futuro (código html de página no encontrada), lo más fácil que puedes hacer es integrar Wayback Machine en tu navegador. Puedes instalar en tu navegador una serie de extensiones para  Safari, Chrome, y Firefox  que te permiten ver las versiones archivadas de las páginas web con sólo pulsar un botón.

Si encuentras algo que crees que debe ser preservado, puedes usar esta herramienta para asegurarte de que Wayback Machine capture una instantánea de ello. Es tan sencillo como visitar web.archive.org/save y pegar la URL deseada. Si tienes el plugin para el navegador, puedes guardar cualquier página que visites con sólo pulsar un botón.

Guía para la evaluación de los procesos de preservación en repositorios institucionales de investigación

Guía para la evaluación de los procesos de preservación en repositorios institucionales de investigación. Madrid: REBIUN, 2020

Texto completo

La presente Guía tiene como finalidad permitir una auditoría interna para establecer posibles acciones de preservación digital en los repositorios institucionales de las universidades y el CSIC. Se engloba dentro de la acción 5 del Grupo de Repositorios de REBIUN para el año 2020. En 2018 el Grupo realizó una encuesta , basada en los niveles establecidos por la National Digital Stewardship Alliance (NDSA), para determinar en qué medida los repositorios están desarrollando actividades de preservación digital. Con una tasa de respuestas del 90% (52 encuestas respondidas de 58 repositorios REBIUN contactados), se pudo concluir que los repositorios no están aplicando las medidas técnicas de preservación al nivel de su compromiso público. La presente Guía, basada en los mismos criterios NDSA pero ampliada con otras prácticas en preservación digital y con la experiencia de los miembros del grupo de trabajo, pretende servir de referente para plantear a nivel político y técnico los puntos fuertes y las medidas de mejora en cuanto a la preservación de los materiales y metadatos almacenados en los repositorios institucionales.

Planificación e implementación de un programa de preservación digital sostenible en bibliotecas

ltr_55n6_cover_232x300

 “Planning and Implementing a Sustainable Digital Preservation Program,” by Erin Baucom. Library Technology Reports (vol. 55, no. 6), 2019

Texto completo

Cada vez más bibliotecas están ampliando sus programas de digitalización, investigaciones digitales, archivo digital y gestión de datos. Todo este esfuerzo podría perderse debido a una falla importante de la tecnología, un cambio en las prioridades administrativas o una pérdida de memoria institucional. La pérdida no sería solo los materiales en sí, sino también los recursos utilizados para construir y promover estas colecciones entre los usuarios. Library Technology Reports (vol. 55, no. 6), “Planificación e implementación de un programa de preservación digital sostenible”, ayudará a las bibliotecas a evaluar sus habilidades actuales, determinar qué están comprometidas a preservar, desarrollar apoyo administrativo y tecnológico y crear un sistema digital programa de preservación que será sostenible a través del cambio organizacional y tecnológico.

Encuesta sobre la capacidad y las necesidades de preservación digital en las instituciones canadienses de memoria, 2017-18

 

c_lagom_-_fotolia.com_-635x320-1

 

 

Final Report of the Survey on Digital Preservation Capacity and Needs at Canadian Memory Institutions, 2017-18. Produced by Grant Hurley and Kathleen Shearer
for the CARL Digital Preservation Working Group, 2019

Texto completo

 

La preservación digital presenta uno de los mayores desafíos para la memoria y la cultura instituciones en la era moderna. Los nuevos recursos y el conocimiento especializado deben coincidir con los complejos componentes organizativos, normativos y técnicos que pueden ayudar a la la persistencia de los contenidos digitales en el futuro. ¿Cómo podemos asegurar que el contenido digital de valor para los ciudadanos está disponible a perpetuidad? ¿Cuáles son las lagunas que necesitan y cómo se puede apoyar a las instituciones esta tarea? En 2017 y 2018, la Asociación Canadiense de Bibliotecas de Investigación (CARL) inspeccionó bibliotecas, museos, galerías y archivos para determinar el estado actual de preservación digital en el Canadá y para comprender mejor los problemas y necesidades que se derivan de este trabajo

 

 

HatiTrush: valor de los proyectos cooperativos de preservación de colecciones durante la clausura de bibliotecas

 

4999d5a3436f3335fa7e661d6eb65c25

 

HathiTrust: A digital library revolution takes flight Wednesday, May 13, 2020

Texto completo

 

La frase “cerrado hasta nuevo aviso debido al COVID-19” se ha vuelto demasiado familiar. Y, si bien hemos comenzado a acostumbrarnos a perder el acceso a muchos recursos que generalmente definen nuestra existencia comunitaria, hay uno que es particularmente crucial para los investigadores, estudiantes y profesores: las bibliotecas. Si una biblioteca es importante para cualquier persona, para un investigador es una herramienta fundamental.

En 2008, las Bibliotecas de la UC cofundaron HathiTrust y comenzaron a contribuir con copias escaneadas de libros y revistas a la nueva organización. Con sede en la Universidad de Michigan (UM), HathiTrust es un repositorio a gran escala de contenido digital creado en colaboración por instituciones académicas y de investigación. A medida que los investigadores perdieron el acceso a materiales vitales impresos durante los cierres de bibliotecas, se inició un servicio denominado Emergency Temporary Access Service (ETAS)) para dar a los investigadores de la UC acceso crítico a más de 13 millones de volúmenes digitales.

Asociaciones como HathiTrust y Google Books son esenciales para los esfuerzos de digitalización de las universidades porque minimizan significativamente los recursos que cada uno debe gastar para preservar las colecciones individuales. Por ejemplo, una vez que UM ha escaneado un libro que se encuentra en la colección física de UC, UC, en teoría, no necesita digitalizar el mismo libro para su colección digital HathiTrust. Esta superposición entre las bibliotecas universitarias es de millones de libros, y hacerlo de manera común ahorra mucbo dinero. Además de ahorrar tiempo y dinero, estos esfuerzos coordinados minimizan el daño potencial a los volúmenes frágiles más antiguos, particularmente aquellos que son demasiado delicados para permanecer en circulación.

La intención original de Google Books era digitalizar la totalidad de las publicaciones del mundo. Si bien este concepto fue ilusionante en términos de investigación y acceso, fue problemático desde la perspectiva de la industria editorial. Google se enfrentó a varias demandas de derechos de autor antes de adaptarse a su política de uso actual, que permite el acceso sin restricciones a los materiales de dominio público y solo proporciona los resultados de búsqueda básicos para volúmenes con derechos de autor. Los textos bajo derechos de autor deben ser accedidos de manera física, ya sea comprándolos o tomándolos prestados de una biblioteca o institución que los haya comprado.

En tiempos normales, el acceso a través de HathiTrust es similar: sirve como un complemento muy necesario de las existencias de impresiones digitalizadas de las colecciones de muchas bibliotecas miembro, pero normalmente no proporciona acceso a texto completo para materiales con derechos de autor.

Cuando  UC, por ejemplo, contribuye con un libro de texto de botánica a HathiTrust, el libro físico vuelve a su biblioteca después de escanearlo. Por ejemplo, un estudiante podría  consultar el libro de texto impreso mientras otros tres lo leerían  simultáneamente en HathiTrust, de este modo, la universidad tendía cuatro puntos de acceso y solo habría pagado uno. Por esta razón, mientras HathiTrust archiva el texto completo de los volúmenes con derechos de autor, las restricciones de copyright impiden que los investigadores los lean.

Durante el periodo de Acceso Temporal de Emergencia (ETAS), por la pandemia, HathiTrust ha permitido que los materiales con derechos de autor seleccionados dentro de sus colecciones fueran accesibles para los investigadores de las instituciones contribuyentes que están experimentando una interrupción inesperada o involuntaria del servicio. El período ETAS puede parecer bastante sencillo, pero de hecho es revolucionario. Por lo general, si los investigadores de la UC en un campus necesitan un volumen en otro campus, pueden solicitar el libro a través de un préstamo interbibliotecario, creando las condiciones para que la comunidad universitaria acceda a una increíble cantidad de información durante la crisis.

El periodo especial de acceso de emergencia ETAS de  HathiTrust, es como su nombre lo expresa claramente, un servicio temporal de emergencia. Pero la experiencia de cómo su acceso sin precedentes ha apoyado  la investigación en estos momentos difíciles perdurará mucho más allá de la crisis.

Avanzar en las bibliotecas de arte y los archivos web curados

 

d6b5d52feba9a410080dbb243c1d2a90

 

Karl-Rainer Blumenthal, Web Archivist for Archive-It. New report: Advancing Art Libraries and Curated Web Archives.

Texto completo

 

Este informe fue producido por Internet Archive y el New York Art Resources Consortium (NYARC) como parte de la subvención de liderazgo nacional del Instituto de Servicios de Museos y Bibliotecas (IMLS), “Avanzando en Bibliotecas de Arte y Archivos Web Curados” (LG-88-18 -0069-18). Resume la investigación, los eventos y la evaluación que llevó a cabo el equipo del proyecto para convocar a una comunidad de práctica de archivo web entre las bibliotecas de arte y museos y planificar su sostenibilidad.