La decadencia de la web: El 38% de las páginas web de 2013 ya no están disponibles

diseño página web

Un reciente análisis del Pew Research Center revela la sorprendente transitoriedad del contenido en línea, destacando que el 38% de las páginas web que existían en 2013 han desaparecido una década después. Este estudio proporciona una visión detallada sobre la desaparición de contenido digital y la disminución de enlaces funcionales en diversas plataformas de internet.

Un Vistazo al Decaimiento Digital

El análisis del Pew Research Center se centró en la revisión de una muestra representativa de páginas web desde 2013 hasta 2023, utilizando el repositorio web Common Crawl. Los resultados muestran que aproximadamente el 25% de las páginas web que existieron en algún momento durante este período ya no están accesibles a partir de octubre de 2023. Esta cifra incluye tanto páginas individuales que han sido eliminadas como dominios enteros que han dejado de funcionar.

El fenómeno de la desaparición digital es aún más marcado para el contenido más antiguo. En el caso de las páginas de 2013, el 38% ya no está disponible, en comparación con solo el 8% de las páginas del año 2023. Esta tendencia refleja un rápido deterioro del contenido en la web con el paso del tiempo.

Ruptura de Enlaces en Sitios Web

El estudio también examina la funcionalidad de los enlaces en sitios web gubernamentales, de noticias y en Wikipedia. En los sitios de noticias, el 23% de las páginas presentan al menos un enlace roto, mientras que en los sitios gubernamentales el 21% de las páginas tienen enlaces inoperativos. Entre los sitios con mayor tráfico y los de menor tráfico, la prevalencia de enlaces rotos es similar. A nivel local, las páginas web gubernamentales de ciudades tienen una mayor incidencia de enlaces rotos.

En Wikipedia, el 54% de las páginas de referencias contienen al menos un enlace que ya no es accesible. Esto subraya la dificultad de mantener enlaces activos en una plataforma con una gran cantidad de referencias externas.

Impacto en Redes Sociales

El estudio también analizó la durabilidad de los posts en redes sociales, con un enfoque en Twitter, ahora conocido como X. Se descubrió que el 18% de los tweets públicos recopilados entre marzo y abril de 2023 habían desaparecido de la vista pública después de tres meses. En el 60% de los casos, la cuenta que originó el tweet fue eliminada o se volvió privada. En el 40% restante, el tweet fue eliminado individualmente pero la cuenta permaneció activa.

Los tweets en idiomas como el turco y el árabe tienden a desaparecer con mayor frecuencia, y los tweets provenientes de cuentas con configuraciones predeterminadas también tienen una mayor probabilidad de ser eliminados. Los tweets de cuentas no verificadas y de reciente creación son particularmente propensos a desaparecer.

Definición de Contenido Inaccesible

El estudio define el contenido inaccesible como aquel que ya no está disponible en su servidor de origen o cuyo contenido ha cambiado significativamente. La investigación se centró en páginas que ya no existen, excluyendo otros tipos de problemas de accesibilidad como la dificultad para leer el contenido debido a discapacidades.

Conclusión

La desaparición de contenido digital y la ruptura de enlaces reflejan la efímera naturaleza del material en línea. La investigación de Pew destaca la importancia de conservar y gestionar el contenido digital para preservar la información a largo plazo, y plantea la necesidad de estrategias efectivas para abordar el deterioro digital en la web.

Este estudio subraya la necesidad de una mayor estabilidad en la gestión de recursos en línea y la preservación de la integridad de los enlaces y páginas web, tanto en plataformas gubernamentales como en medios de comunicación y redes sociales.

Scroll al inicio