Au fil des ans, les cookies tiers sont devenus le moteur principal du commerce publicitaire numérique, mais les préoccupations croissantes concernant les atteintes à la vie privée ont conduit les principaux fournisseurs de navigateurs, tels qu'Apple, Mozilla, Brave et Microsoft, à introduire des contre-mesures pour mettre fin à la technologie de suivi invasive. Ce qui a obligé Google à réagir en proposant des solutions similaires de protection de la vie privée, sous peine de perdre la confiance de ses clients. L’une des propositions est le FLoC (Apprentissage fédéré des cohortes). Le géant de la recherche – dans une tentative d'équilibrer son double rôle de développeur de navigateur Web et de propriétaire de la plus grande plateforme publicitaire du monde – a annoncé au début de l'année dernière son intention d'éliminer les cookies tiers dans Chrome au profit d'un nouveau cadre appelé "Privacy Sandbox", qui vise à protéger l'anonymat tout en diffusant des publicités ciblées sans avoir recours à des techniques plus opaques comme les empreintes informatiques.
À cet effet, Google a proposé un ensemble de méthodes de ciblage et de mesure des annonces publicitaires, en constante évolution, visant à supplanter les cookies tiers, dont les principaux sont le FLoC et le TURTLEDOVE, dont il espère qu'ils feront émerger les normes de diffusion des annonces sur le Web.
Le FLoC vise essentiellement à classer les utilisateurs en ligne en groupes basés sur des comportements de navigation similaires, le navigateur de chaque utilisateur partageant ce que l'on appelle un "identifiant de cohorte" avec les sites Web et les spécialistes du marketing, qui peuvent alors cibler les utilisateurs avec des publicités basées sur les groupes auxquels ils appartiennent. Si cela n’est pas assez clair, pensez à ceci : votre "FLoC ID" sera comme un résumé succinct de votre activité récente sur le Web, qui sera partagé afin que vous receviez des publicités.
En d'autres termes, les données recueillies localement à partir du navigateur ne sont jamais partagées et ne quittent jamais l'appareil. En utilisant cette approche publicitaire basée sur les intérêts, l'idée est de cacher les utilisateurs "dans la foule", ce qui permet de garder privé l'historique de navigation d'une personne et offre des protections contre le suivi et le profilage individualisés.
Signifiant un changement majeur dans son modèle commercial axé sur les annonces, Google a déclaré mercredi sans équivoque qu'il ne construirait pas d'autres identificateurs ou outils pour suivre les utilisateurs sur plusieurs sites Web une fois qu'il commencera à éliminer progressivement les cookies de suivi tiers de son navigateur Chrome d'ici le début de 2022.
« Nos produits Web seront plutôt alimentés par des API préservant la vie privée qui empêchent le suivi individuel tout en fournissant des résultats aux annonceurs et aux éditeurs », a déclaré David Temkin, directeur de la gestion des produits de Google pour la confidentialité et la confiance dans les annonces. « Les progrès réalisés en matière d'agrégation, d'anonymisation, de traitement sur les appareils et d'autres technologies de protection de la vie privée ouvrent la voie au remplacement des identifiants individuels ».
La preuve de concept de Google a utilisé les domaines des sites que chaque utilisateur a visités comme base pour regrouper les gens. Il a ensuite utilisé un algorithme appelé SimHash pour créer les groupes. SimHash peut être calculé localement sur la machine de chaque utilisateur, il n'est donc pas nécessaire d'avoir un serveur central pour collecter les données comportementales. Cependant, un administrateur central pourrait jouer un rôle dans l'application des garanties de confidentialité.
Afin d'éviter qu'une cohorte ne soit trop petite (c'est-à-dire trop identifiante), Google propose qu'un acteur central puisse compter le nombre d'utilisateurs affectés à chaque cohorte. Si certaines sont trop petites, elles peuvent être combinées avec d'autres cohortes similaires jusqu'à ce qu'un nombre suffisant d'utilisateurs soit représenté dans chacune d'entre elles. Pour que le FLoC soit utile aux annonceurs, la cohorte d'un utilisateur révélera nécessairement des informations sur son comportement, d’après un document nommé "Évaluation des algorithmes de cohorte pour l'API Floc" publié sur GitHub.
Google va tester publiquement des cohortes basées sur FLoC dans le courant de ce mois, en commençant par Chrome 89, avant de prolonger les essais avec les annonceurs dans Google Ads au cours du deuxième trimestre.
Préoccupations liées à la méthode de ciblage FLoC, selon l’EFF
Si ces plans de préservation de la vie privée permettent de réduire la transmission de données personnelles à des tiers, des questions sont soulevées quant à la manière dont les utilisateurs seront regroupés et quant aux garde-fous mis en place pour éviter toute discrimination illégale à l'encontre de certains groupes sur la base d'attributs sensibles tels que l'appartenance ethnique, la religion, le sexe ou l'orientation sexuelle.
Soulignant, dans un article publié mercredi, que la nouvelle proposition implique le partage de nouvelles informations avec les annonceurs, l'Electronic Frontier Foundation (EFF) a assimilé le FLoC à un « score de crédit comportemental », le qualifiant de « terrible idée » qui crée de nouveaux risques pour la vie privée.
« Le FLoC est censé être un nouveau moyen de faire en sorte que votre navigateur fasse le profilage que les traqueurs tiers faisaient eux-mêmes : dans ce cas, il s'agit de réduire votre activité de navigation récente en un label comportemental, puis de le partager avec les sites Web et les annonceurs. Cette technologie permettra d'éviter les risques d'atteinte à la vie privée liés aux cookies tiers, mais elle en créera de nouveaux au cours du processus. Elle peut également exacerber bon nombre des pires problèmes de non-respect de la vie privée liés aux publicités...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Que pensez-vous de l'API Topics dans sa conception ? Répond-elle efficacement, selon vous, aux préoccupations soulevées par FloC ?