Una guía para archivar en Internet y por qué tener registros es esencial para los verificadores de hechos.

Ibrahim, Nur. «A Guide to Archiving on the Internet». Snopes, 12 de noviembre de 2022. https://www.snopes.com/articles/463946/articlesnewarchiving-on-the-internet/.

Mantener registros en Internet es esencial para entender no sólo la historia de la web, sino también para ayudarnos a rastrear si un tweet fue borrado alguna vez, o si alguien modificó una declaración en una página web.

Los gobiernos también mantienen archivos de las páginas web de cada administración, en aras de la transparencia y el acceso público. El sitio web de la Casa Blanca del ex presidente estadounidense Donald Trump es trumpwhitehouse.archives.gov, mientras que el sitio web de la Casa Blanca de Barack Obama puede encontrarse en obamawhitehouse.archives.gov. Y la administración Clinton creó el primer sitio web de la Casa Blanca en 1994. Estos sitios están etiquetados como «material histórico, «congelado en el tiempo»». Algunos sitios federales son «cosechados» y guardados por el Federal Depository Library Program Web Archive , cuyo objetivo es «proporcionar acceso público permanente al contenido de la web de las agencias federales».

Las estimaciones sobre la vida media de una página web varían con el tiempo. En 1997  Scientific American estimó que era de 44 días, y el New Yorker en 2015 sugirió que podría ser de 100 días. Pero algunas páginas web pueden ser eliminadas en cuestión de horas, especialmente si son de naturaleza políticamente sensible.

En 2014, cuando el vuelo 17 de Malaysia Airlines fue derribado sobre el espacio aéreo ucraniano, un líder separatista ucraniano, Igor Girkin, también conocido como Strelkov, habría escrito: «Acabamos de derribar un avión, un AN-26». Aunque un AN-26 es un avión de carga militar de fabricación soviética, las fotografías del post parecían ser de un Boeing 777. Wayback Machine guardó el post, que fue borrado de la página de Strelkov sólo un par de horas después. Cuando un periodista tuiteó una imagen de la página web guardada escribiendo: «Grab of Donetsk militant Strelkov’s claim of downing what appears to have been MH17», la página de Strelkov había sido editada y la afirmación borrada. La única prueba de ese post era la captura de pantalla guardada en archive.org. Aunque el post podría haber sido engañoso, el incidente puso de manifiesto el papel del Internet Archive en la recopilación de testimonios que resultaron útiles para las investigaciones periodísticas.

Internet Archive (archive.org) está considerado como uno de los mayores archivos de Internet, con unos 625.000 millones de páginas web guardadas desde su fundación en 1996. Su herramienta Wayback Machine permite a los usuarios recorrer 25 años de historia de la web, y la organización se asocia con Federal Depository Library Program Web Archive y otras organizaciones a través de  Archive-It.

¿Cómo archivar una página web?

Sin embargo, el sitio más sencillo para empezar es archive.org. Aquí, basta con introducir un enlace en la Wayback Machine para ver si ya existe, haciendo clic en «Browse History». Debajo de eso, otra opción te permite «Guardar la página ahora» y crear un nuevo enlace.

Si quieres navegar por el historial de una página web, serás dirigido a todas las instancias pasadas en las que se ha archivado, organizadas como un calendario, hasta el mes, el día y la hora en que se guardó. Puedes hacer clic en una fecha (indicada por una burbuja azul) para acceder a una página web. Cuanto más grande sea la burbuja, más veces se ha archivado una página en ese día. Hay que tener en cuenta que un enlace verde indica que una página web fue redirigida, y puede no funcionar, por lo que los usuarios deben hacer clic en los enlaces azules.

La parte superior de la página de resultados de la búsqueda también indica a los usuarios cuántas veces se archivó una página web y el intervalo de fechas. La barra superior muestra los años en que se guardaron las páginas, mientras que el calendario que aparece debajo nos permite hacer clic en el mes, el día y la hora.

¿Cómo sabemos que las páginas archivadas no están manipuladas?

Aunque la gente ha hecho capturas de pantalla de páginas web y tweets en el pasado, es más fácil manipular simples imágenes que editar una página web ya archivada.

Además, las capturas de pantalla son estáticas. No se puede interactuar con la página, ni desplazarse, ni pasar el ratón, ni hacer clic en los enlaces, ni siquiera revelar a qué páginas web se refieren los enlaces de la página.