Et 54 % des pages Wikipédia contiennent au moins un lien brisé

Quand le contenu en ligne disparaît : 38 % des pages web qui existaient en 2013 ne sont plus accessibles dix ans plus tard

Un quart de toutes les pages web qui ont existé à un moment donné entre 2013 et 2023 ne seront plus accessibles à partir d'octobre 2023. Dans la plupart des cas, cela est dû au fait qu'une page individuelle a été supprimée ou retirée d'un site web par ailleurs fonctionnel.



Pour les contenus plus anciens, la tendance est encore plus marquée. Quelque 38 % des pages web qui existaient en 2013 ne sont plus accessibles aujourd'hui, contre 8 % des pages qui existaient en 2023.

23 % des pages web d'actualités contiennent au moins un lien brisé, tout comme 21 % des pages web des sites gouvernementaux. Les sites d'actualités très fréquentés et ceux qui le sont moins ont à peu près la même probabilité de contenir des liens rompus. Les pages web des administrations locales (celles qui appartiennent aux gouvernements municipaux) sont particulièrement susceptibles de contenir des liens rompus.



54 % des pages de Wikipédia contiennent au moins un lien dans leur section "Références" qui pointe vers une page qui n'existe plus.

Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié. Dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours.



Certains types de tweets ont tendance à disparaître plus souvent que d'autres. Plus de 40 % des tweets rédigés en turc ou en arabe ne sont plus visibles sur le site dans les trois mois suivant leur publication. Les tweets provenant de comptes dont les paramètres de profil sont par défaut sont particulièrement susceptibles de disparaître de la vue du public.

Avec des centaines de milliards de pages web indexées, l'internet est un répertoire incroyablement vaste de la vie moderne. Mais alors que les utilisateurs du monde entier comptent sur le web pour accéder à des livres, des images, des articles d'actualité et d'autres ressources, ce contenu disparaît parfois de la vue.Une nouvelle analyse du Pew Research Center montre à quel point le contenu en ligne est éphémère :Cette "dégradation numérique" se produit dans de nombreux espaces en ligne différents. Les analystes ont examiné les liens qui apparaissent sur les sites web gouvernementaux et d'information, ainsi que dans la section "Références" des pages Wikipédia au printemps 2023. Cette analyse a révélé que :Pour voir comment la dégradation numérique se manifeste sur les médias sociaux, ils ont également recueilli un échantillon de tweets en temps réel au printemps 2023 sur la plateforme de médias sociaux X (connue à l'époque sous le nom de Twitter) et les avons suivis pendant trois mois. Ils ont constaté que :