Hirsch, Matt. «Link Rot: How Web Pages Are Lost to Time». Bold TV (blog), 15 de junio de 2023. https://boldtv.com/matthew-hirsch/2023/06/15/link-rot-how-web-pages-are-lost-to-time/.

Pérdida de enlaces: Cómo las páginas web se pierden en el tiempo

El 1 de enero de 2023, Internet cumplió 40 años. En los cuarenta años transcurridos desde su creación, los usuarios han subido una cantidad insondable de datos a la red mundial. Sólo en 2022, se subieron a la red 97 zettabytes (97 billones de gigabytes) de datos nuevos. Y esa cifra aumenta cada año. La mayoría considera Internet una especie de Biblioteca de Alejandría moderna. Se pueden encontrar respuestas a (casi) cualquier pregunta. Sin embargo, los enlaces a muchas páginas antiguas ya no funcionan. Estas páginas muertas han sucumbido a un fenómeno conocido como «link rot».

¿Qué causa la pérdida de enlaces y por qué es un problema importante?

Según The Verge, alrededor del 72% de los enlaces generados en 1998 han sucumbido por la rotura de enlaces. Varias razones pueden hacer que una URL (localizador uniforme de recursos) deje de funcionar y muestre el temido mensaje de «error 404». Por ejemplo, el propietario de una página web puede cambiar de host, el nombre del dominio ha caducado o el sitio se ha caído por completo.

Entonces, ¿por qué es un problema la rotura de enlaces? En 2023, nuestras vidas giran en torno a Internet. Según el Pew Research Center, el 85% de los estadounidenses afirma conectarse a Internet a diario. Y casi un tercio afirma utilizar la red constantemente. Y, sobre todo desde los albores de la era de las redes sociales, utilizamos Internet para conectar con amigos y familiares.

En la última década, hemos guardado muchos de nuestros mejores recuerdos en los servidores de Facebook (o de cualquier otra red social). Es probable que pase algún tiempo antes de que nuestros viejos perfiles sigan el camino de los dinosaurios. Sin embargo, es casi inevitable que ocurra (sobre todo si ya no utilizas la plataforma).

La pérdida de enlaces también causa estragos en periodistas, investigadores y académicos que intentan citar material antiguo. Por ejemplo, según Harvard, más del 70% de las páginas web estudiadas en una revista jurídica no enlazan con las fuentes originales. Cerca de la mitad de los enlaces de las opiniones del Tribunal Supremo de Estados Unidos estudiadas estaban rotos. Y cerca de tres cuartas partes de los enlaces examinados por los investigadores conducían a contenidos distintos de los que citaban. Además, un estudio de la Universidad Tecnológica de Nanyang, en Singapur, demostró que el problema afecta sobre todo a los enlaces «.edu», con un 36%.

¿Cómo podemos salvar nuestros datos?



Varias organizaciones y entidades sin ánimo de lucro se dedican a archivar datos antiguos en la Red. Internet Archive es una biblioteca digital fundada por el ingeniero informático Brewster Kahle en 1996. El público puede cargar y descargar libremente datos de su colección. También guarda páginas web antiguas ya desaparecidas y permite a cualquiera acceder a ellas a través de su navegador, Wayback Machine. En 2023, habrá 811 millones de páginas web antiguas archivadas en Wayback Machine.

Y en el ámbito académico, donde la perdidade enlaces es un problema más acuciante, Perma.cc es el servicio de archivo de referencia. Harvard Law School Library Innovation Lab fundó este archivo académico en 2013 como respuesta directa a este problema. Y en 2016, el Instituto de Servicios de Museos y Bibliotecas les concedió una subvención de 700.000 dólares para ampliar Perma.cc. Se diferencia de Wayback Machine en que no utiliza rastreadores web para recorrer Internet.

A nivel individual, lo mejor que puedes hacer para conservar tus recuerdos digitales es almacenarlos fuera de Internet. Las plataformas de redes sociales adoptan cada vez más políticas de eliminación de perfiles inactivos.