HTTP Archive est une sous-organisation de l'Internet Archive, connue entre autres pour sa Wayback Machine (un site Web qui offre un accès à des clichés instantanés de pages Web stockés par l'organisme). Dans le cadre du rapport "Web Almanac", HTTP Archive explore 8,2 millions de sites Web par mois et effectue différentes analyses. Il s'agit par exemple de la taille des fichiers transmis, des techniques de mise en cache utilisées ou des interfaces Web utilisées. Au total, 39,5 téraoctets de données sont générés. Le Web Almanac est un rapport complet sur l'état du Web, étayé par des données réelles et des experts de confiance du Web.
Environ 112 auteurs, analystes et réviseurs de la communauté se sont réunis pour analyser l'état du Web en 2021. L'analyse a révélé que les API les plus utilisées sont Async Clipboard et Web Share ; environ 9 % de tous les sites Web utilisent du code qui fait appel à ces interfaces. Selon HTTP Archive, l'année dernière, l'utilisation de l'API Async Clipboard a été multipliée par 10. L'équipe de recherche a également découvert que 641 millions d'emails, 428 millions de mots de passe et 149 millions de numéros de téléphone ont été impliqués dans des violations de données en 2021.
Par ailleurs, 22 % des sites seraient équipés de HSTS (HTTP Strict Transport Security). HSTS indique aux navigateurs de toujours utiliser HTTPS. Voici les autres faits saillants du Web Almanac.
Les tendances HTML et les CMS les plus populaires
- seulement 65 % des pages comportent un h1 ;
- en parlant des principes fondamentaux du HTML : 33 % des champs de saisie n'ont pas de nom accessible fourni par exemple par un label ;
- Wordpress alimente 33 % de tous les sites scannés ;
- près de 30 % des pages incluent role="button" quelque part ;
- etc.
Les tendances en rapport avec les feuilles de styles
- la page Web médiane charge 70 Ko de CSS. Le "site le mieux noté" a chargé plus de 60 Mo de CSS ;
- il y a un nouveau record pour le nombre de feuilles de style externes chargées : 2368 ;
- la majorité des déclarations de longueur utilisent des pixels : environ 70 % des déclarations de taille de police sont en pixels ;
- le format hexadécimal est le principal moyen de définir les couleurs ;
- le site avec le plus grand nombre d'images chargées a chargé plus de 300 Mo d'images via CSS ;
- seulement 3 % des pages utilisent CSS-in-JS (une technique de stylisation où JavaScript est utilisé pour styliser les composants) ;
- presque tous les sites incluent des ressources tierces. HTTP Archive estime que ce fait n'est pas surprenant, car cela inclut le traçage, les librairies d'un CDN, les lecteurs vidéo et toutes ces choses ;
- etc.
Les tendances JavaScript et les frameworks JS populaires
- nous envoyons tous beaucoup de JavaScript. C'est plus de 420 Ko par page au 50e percentile. Il s'agit d'octets transférés, la quantité de JavaScript est donc bien plus importante après décompression ;
- l'analyse portant sur l'adoption des bibliothèques et des frameworks JavaScript montre que 84 % des sites Web utilisent jQuery et 8 % sont construits avec React ;
- environ 20 % des sites ne définissent pas l'attribut lang ;
- il n'y a pratiquement aucune adoption de WebAssembly (Wasm). HTTP Archive a enregistré 3854 demandes WebAssembly confirmées sur le bureau et 3173 sur le mobile. Ces modules Wasm sont utilisés dans 2 724 domaines sur ordinateur de bureau et 2 300 domaines sur mobile, ce qui représente 0,06 % et 0,04 % de tous les domaines sur ordinateur de bureau et sur mobile respectivement ;
- les ressources tierces sont principalement utilisées pour les publicités, les "inconnus" et les services de bibliothèque des CDN ;
- les ressources tierces les plus utilisées sur le Web proviennent de Google ;
- si les ressources YouTube sont intégrées, elles entraînent un temps de blocage médian de 1,6 seconde ;
- un fichier robots.txt n'est pas obligatoire (s'il n'est pas là, toutes les pages sont libres d'être indexées), et 16 % des sites n'envoient pas un fichier robots.txt ;
- etc.
Source : Web Almanac 2021
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous des tendances rapportées par HTTP Archive ?
Que pensez-vous de l'adoption de WebAssembly ? Pourquoi peine-t-elle à décoller ?
Voir aussi
Chrome Dev Summit 2019 : Google voudrait apporter aux internautes des expériences qui se rapprochent du natif et propose des API à cet effet aux développeurs
Le DNS-over-HTTPS finira probablement par être déployé sur tous les navigateurs, malgré l'opposition des FAI, le support du DoH est déjà effectif sur Edge, Firefox, Opera, Vivaldi, Chrome et Brave
Le langage JavaScript est-il responsable de la lenteur des sites Web de nos jours ? Oui, selon un expert