Avec des centaines de milliards de pages web indexées, l'internet est un répertoire incroyablement vaste de la vie moderne. Mais alors que les utilisateurs du monde entier comptent sur le web pour accéder à des livres, des images, des articles d'actualité et d'autres ressources, ce contenu disparaît parfois de la vue.
Une nouvelle analyse du Pew Research Center montre à quel point le contenu en ligne est éphémère :
- Un quart de toutes les pages web qui ont existé à un moment donné entre 2013 et 2023 ne seront plus accessibles à partir d'octobre 2023. Dans la plupart des cas, cela est dû au fait qu'une page individuelle a été supprimée ou retirée d'un site web par ailleurs fonctionnel.
- Pour les contenus plus anciens, la tendance est encore plus marquée. Quelque 38 % des pages web qui existaient en 2013 ne sont plus accessibles aujourd'hui, contre 8 % des pages qui existaient en 2023.
Cette "dégradation numérique" se produit dans de nombreux espaces en ligne différents. Les analystes ont examiné les liens qui apparaissent sur les sites web gouvernementaux et d'information, ainsi que dans la section "Références" des pages Wikipédia au printemps 2023. Cette analyse a révélé que :
- 23 % des pages web d'actualités contiennent au moins un lien brisé, tout comme 21 % des pages web des sites gouvernementaux. Les sites d'actualités très fréquentés et ceux qui le sont moins ont à peu près la même probabilité de contenir des liens rompus. Les pages web des administrations locales (celles qui appartiennent aux gouvernements municipaux) sont particulièrement susceptibles de contenir des liens rompus.
- 54 % des pages de Wikipédia contiennent au moins un lien dans leur section "Références" qui pointe vers une page qui n'existe plus.
Pour voir comment la dégradation numérique se manifeste sur les médias sociaux, ils ont également recueilli un échantillon de tweets en temps réel au printemps 2023 sur la plateforme de médias sociaux X (connue à l'époque sous le nom de Twitter) et les avons suivis pendant trois mois. Ils ont constaté que :
- Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié. Dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours.
- Certains types de tweets ont tendance à disparaître plus souvent que d'autres. Plus de 40 % des tweets rédigés en turc ou en arabe ne sont plus visibles sur le site dans les trois mois suivant leur publication. Les tweets provenant de comptes dont les paramètres de profil sont par défaut sont particulièrement susceptibles de disparaître de la vue du public.
Source : Pew Research Center
Et vous ?
Pensez-vous que cette analyse est crédible ou pertinente ?
Quel est votre avis sur le sujet ?
Voir aussi :
Est-ce la fin du Web tel que nous le connaissons ? Les détracteurs de l'IA craignent la destruction d'une précieuse ressource publique, bien que certains perçoivent ces changements comme des améliorations
90% du contenu en ligne pourrait être « généré par l'IA d'ici 2025 », selon une conférencière en IA. « Les choses qui nous émerveillent début 2023 vont sembler pittoresques d'ici la fin de l'année »
fleche: Les URL de Twitter redirigent vers x.com alors que Musk s'apprête à tuer le nom Twitter. Des milliards de $ en reconnaissance de marque (tweeter est un verbe) jetés à l'eau pour satisfaire l'ego d'un seul homme