La rotura de enlaces y la deriva de contenido son endémicas de la web tal como está diseñada actualmente
Si estás navegando por la web y te encuentras con una página de error 404 o una redirección inesperada, has visto un enlace roto en acción. Con el tiempo, los enlaces que mantienen unida la web se rompen, lo que amenaza nuestra historia cultural compartida. He aquí un vistazo a por qué sucede eso.
¿Qué es la rotura de enlaces?
La rotura del enlace es cuando los enlaces en los sitios web se rompen con el tiempo, creando un enlace roto o inactivo. Por "enlace roto" nos referimos a un enlace que ya no apunta a su destino previsto desde que se creó por primera vez. Cuando haces clic en uno de estos enlaces rotos, obtienes un error 404 o ves la página o el sitio web incorrectos.
Los enlaces rotos son comunes. Un estudio de Harvard de 2021 [PDF] examinó los hipervínculos en más de 550.000 artículos del New York Times entre 1996 y 2019 y descubrió que eran inaccesibles el 25% de los enlaces a páginas específicas, con la tasa de descomposición creciendo dramáticamente dependiendo de la antigüedad de los enlaces (por ejemplo, alrededor del 6% de los enlaces de 2018 estaban inactivos frente al 72% de los enlaces de 1998). Otro estudio encontró que de un conjunto de 360 enlaces recopilados en 1995, solo el 1,6% aún funcionaba en 2016.
¿Por qué ocurre la rotura del enlace?
La web es un medio fluido y descentralizado sin control centralizado, por lo que el contenido puede dejar de estar disponible en cualquier momento sin previo aviso. Los servidores van y vienen, los sitios web se cierran, los servicios migran a nuevos hosts, el software se actualiza, las publicaciones cambian a nuevas plataformas de administración de contenido y no migran el contenido, los dominios caducan y más.
Hay otro problema relacionado en la web llamado "desviación de contenido", donde el enlace sigue funcionando pero el contenido del enlace ha cambiado desde el enlace original, lo que puede causar problemas porque el autor original del enlace tenía la intención de apuntar a información diferente.
¿Qué tiene de malo perder sitios web antiguos?
Es la naturaleza del mundo que las cosas se deterioren y desaparezcan. Mantener viva la información es un proceso activo que requiere tiempo, energía y esfuerzo. Entonces, el principal problema con la rotura de enlaces no es necesariamente que necesitemos almacenar toda la información para siempre, sino que la información y las referencias electrónicas se han vuelto potencialmente más frágiles y vulnerables que las que se usaban en el pasado principalmente en papel.
Muchos autores de artículos periodísticos, documentos académicos e incluso decisiones judiciales utilizan enlaces web como mecanismo de citación para proporcionar fuentes vitales de contexto a la información presentada. También ha sido un problema con Wikipeda. Como explicó Jonathan Zittrain en un artículo de 2021 sobre la rotura de enlaces para The Atlantic, "La fuente es el pegamento que mantiene unido el conocimiento de la humanidad. Es lo que le permite aprender más sobre lo que solo se menciona brevemente en un artículo como este, y para que otros verifiquen los hechos tal como los represento".
Si los enlaces se rompen y las fuentes dejan de estar disponibles, es mucho más difícil para un lector juzgar si el autor ha representado de manera honesta y precisa la fuente original de información. E incluso más allá de los enlaces, algunos sitios web brindan información en línea que no se puede encontrar en ningún otro lugar. Perder esas páginas crea brechas en el conocimiento colectivo de la humanidad y agujeros en el tejido de nuestra cultura compartida.
¿Cuál es la solución para los enlaces rotos?
Los expertos consideran que la rotura de enlaces y la deriva de contenido son endémicas de la web tal como está diseñada actualmente. Eso significa que es una parte de la naturaleza fundamental de la web que no desaparecerá a menos que intentemos corregirla o mitigarla activamente.
Una de las soluciones más efectivas al problema de la rotura de enlaces surgió en 1996 con Internet Archive, que ha mantenido un archivo público de miles de millones de sitios web durante los últimos 25 años. Si encuentras un enlace roto, visita Wayback Machine de Internet Archive y pega el enlace en su barra de búsqueda. Si el sitio ha sido recogido, podrás navegar por los resultados. O si el sitio dejó de funcionar recientemente, es posible que se puedas ver el contenido original de una copia en caché que almacena Google.
Más allá del Archivo de Internet, un proyecto dirigido por Harvard llamado Perma.cc captura versiones permanentes de sitios web con el objetivo de obtener citas académicas y legales a largo plazo. Un consorcio de bibliotecas mantiene los enlaces, por lo que deberían quedarse por un tiempo. El objetivo es crear enlaces que no se pudran; deben persistir mientras se mantenga el archivo Perma.cc.
Otras posibles soluciones para la rotura de enlaces todavía están en la vanguardia, incluidas las posibles soluciones Web 3.0 y el alojamiento de datos distribuidos gracias a protocolos como IPFS. Aunque, irónicamente, dentro de cientos de años, es posible que los únicos sitios web de esta era que sobrevivan sean los que la gente imprimió en papel.