
Une coalition de fournisseurs d'infrastructures web et de créateurs de contenu, menée par Matthew Prince, PDG de Cloudflare, conteste les aperçus de l'IA de Google pour détourner le trafic des éditeurs sans compensation. Cette opposition comprend le blocage des robots d'indexation IA, des poursuites judiciaires et des plaintes réglementaires, ce qui pourrait contraindre Google à négocier des accords de partage des revenus et à remodeler les normes relatives aux données web.
Cloudflare, Inc. est une société américaine qui fournit des services de réseau de diffusion de contenu, de cybersécurité, d'atténuation des attaques DDoS, de réseaux étendus, de proxys inversés, de services de noms de domaine, d'enregistrement de domaines accrédités par l'ICANN, et d'autres services. En mai dernier, le PDG de Cloudflare, Matthew Prince, a fait la lumière sur le monde de l'IA, son impact négatif sur Internet et l'univers de la recherche en ligne. Matthew Prince est cofondateur et PDG de la société technologique Cloudflare. Avec une fortune estimée à 5,5 milliards de dollars américains en février 2025, Prince est la personne la plus riche de l'Utah.
Il a qualifié l'IA de fardeau économique, qui brise le modèle économique du web en découplant la création de contenu de la valeur, et a décrit Google comme étant au cœur de la perturbation. Selon Matthew Prince, il s'agit d'une menace directe et majeure pour le Web, et les créateurs de contenu ne peuvent pas continuer à en pâtir car cela se traduirait par une diminution du nombre de contributions originales de leur part et par une augmentation du contenu copié ou reproduit.
Dans la bataille croissante pour l'avenir de la recherche en ligne, une coalition de fournisseurs d'infrastructures web et de créateurs de contenu lance un défi de taille aux aperçus générés par l'IA de Google, qui résument le contenu web directement dans les résultats de recherche. Cette révolte, menée par des personnalités telles que Matthew Prince, PDG de Cloudflare, découle de préoccupations croissantes quant au fait que l'IA de Google détourne le trafic des éditeurs originaux sans compensation équitable ni consentement. Prince a pris une décision audacieuse en annonçant des changements radicaux sur la plateforme Cloudflare, faisant ainsi pression sur Google pour qu'il négocie les conditions d'accès à une grande partie des données Internet.
Ces aperçus basés sur l'IA, déployés par Google ces dernières années, utilisent l'apprentissage automatique pour générer des réponses concises aux requêtes des utilisateurs, souvent à partir de plusieurs sources, mais en les présentant comme une synthèse propre à Google. Les détracteurs affirment que cette pratique sape le modèle économique du web, où les sites dépendent des clics pour générer des revenus publicitaires et des abonnements. Selon une analyse récente, cette fonctionnalité a entraîné une baisse significative du trafic de référence pour de nombreux éditeurs, certains signalant des baisses pouvant atteindre 50 %.
Cloudflare, qui gère une part importante du trafic web mondial, est à l'avant-garde de cette opposition. Prince a déclaré publiquement que son entreprise commencerait à bloquer ou à restreindre les robots d'indexation IA à moins qu'ils ne se conforment à de nouveaux protocoles, une décision qui pourrait contraindre Google à repenser ses stratégies d'ingestion de données. Il ne s'agit pas seulement de rhétorique : les outils de Cloudflare permettent désormais aux propriétaires de sites web de se désinscrire plus facilement de la collecte de données d'entraînement IA, une réponse directe à la domination de Google.
En juillet, Cloudflare a annoncé bloquer par défaut l'accès des robots d'indexation d'intelligence artificielle (IA) aux pages web, tout en offrant aux propriétaires de sites des options plus granulaires pour contrôler le type de robots d'IA qui indexent leurs pages. De plus, Cloudflare a lancé une nouvelle initiative visant à faire payer les services d'IA pour accéder à ces pages, appelée "Pay Per Crawl".
Puis en septembre, Cloudflare a lancé une politique de signalisation de contenu pour contrôler le scraping par IA. La nouvelle politique de signalisation de contenu de Cloudflare étend le fichier robots.txt, permettant aux éditeurs de spécifier des règles d'utilisation de l'IA pour le contenu scrapé, par exemple en autorisant la formation non commerciale tout en interdisant la réutilisation commerciale. Offerte gratuitement, elle donne plus de pouvoir aux créateurs face aux préoccupations croissantes liées au scraping par IA, en s'appuyant sur la conformité volontaire pour favoriser des pratiques éthiques en matière de données et une gouvernance équilibrée du web.
La révolte ne se limite pas à Cloudflare. D'autres acteurs du secteur des infrastructures, notamment les registraires de noms de domaine et les services d'hébergement, envisagent des mesures similaires. En Europe, des syndicats et des groupes militants ont déposé des plaintes officielles auprès des autorités de régulation, alléguant que les fonctionnalités d'IA de Google enfreignent les lois sur la concurrence en privilégiant de manière déloyale ses propres résumés par rapport au contenu original.
Cette tension s'est propagée jusqu'aux tribunaux. Une entreprise américaine spécialisée dans les technologies éducatives a récemment poursuivi Google en justice, affirmant que les aperçus fournis par l'IA réduisaient la demande de contenu original et étouffaient la concurrence, comme le détaille un rapport de Reuters. Le procès met en évidence la manière dont ces outils d'IA, en fournissant des réponses « sans clic », maintiennent les utilisateurs sur la plateforme de Google, privant les éditeurs d'un engagement essentiel.
En Allemagne, des organisations non gouvernementales et des groupes d'éditeurs ont déposé des plaintes en vertu de la loi européenne sur les services numériques, arguant que les pratiques de Google augmentent les risques de désinformation et menacent la pluralité des médias. La plainte expose Google à des amendes pouvant atteindre 6 % de son chiffre d'affaires mondial en cas de violation.
Google a défendu ses aperçus IA comme des améliorations innovantes qui améliorent l'expérience utilisateur, mais des documents internes suggèrent que l'entreprise est consciente de la réaction négative. Une analyse approfondie d'Ars Technica révèle comment la stratégie de Prince vise à « forcer la main à Google », ce qui pourrait conduire à des accords de licence payants similaires à ceux conclus dans le secteur de l'information.
Pour les initiés du secteur, ce conflit souligne un changement crucial : l'infrastructure fondamentale du web se rebelle contre l'expansion incontrôlée de l'IA. Si elles aboutissent, ces initiatives pourraient remodeler les normes d'accès aux données, obligeant les géants de la technologie à partager leurs revenus ou à faire face à des blocages généralisés. Pourtant, Google reste un cas particulier, car de nombreux autres robots d'indexation IA se conforment déjà aux demandes de désinscription, selon les informations de StartupNews.fyi.
En coulisses, des organismes de normalisation tels que l'Internet Engineering Task Force débattent de protocoles visant à différencier les robots IA des robots d'indexation traditionnels. Les propriétaires de sites web veulent des outils permettant de bloquer l'IA tout en autorisant l'indexation des recherches, mais les géants de la technologie s'y opposent, craignant que cela ne limite les données d'entraînement pour les futurs modèles.
Cette révolte n'est pas isolée ; elle s'inscrit dans le cadre d'une réflexion plus large sur l'impact de l'IA sur la création de contenu. Les analyses montrent que les aperçus générés par l'IA réduisent de près de moitié le nombre de clics sur les sites web, ce qui incite les éditeurs à se diversifier pour réduire leur dépendance vis-à-vis de Google. À mesure que le bras de fer s'intensifie, l'issue pourrait redéfinir l'équilibre des pouvoirs entre les moteurs de recherche et l'écosystème du web, garantissant ainsi que l'innovation ne se fasse pas au détriment de la durabilité.
Et vous ?


Voir aussi :

Pour lutter contre le scraping non autorisé de données d'entraînement d'IA comme ChatGPT


Vous avez lu gratuitement 14 357 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.