Guerre des agents IA: Cloudflare vs. Perplexity redéfinit l'économie du web

Fastcompany

La frontière numérique est de nouveau un champ de bataille, opposant cette fois un titan de l’infrastructure internet à une force montante de l’intelligence artificielle. Cloudflare, l’entreprise qui protège une part significative du web, a tracé une ligne définitive contre Perplexity AI, accusant le moteur de recherche basé sur l’IA d’employer des « tactiques furtives » pour contourner les instructions explicites des propriétaires de sites web visant à bloquer la collecte de données. Ce conflit croissant est plus qu’une simple querelle d’entreprise ; il représente un moment charnière qui pourrait redéfinir fondamentalement l’économie du web et la nature même de la propriété du contenu numérique.

Au cœur du litige, Cloudflare allègue que Perplexity AI a utilisé des robots d’exploration web non déclarés et déguisés pour accéder au contenu de dizaines de milliers de domaines, générant des millions de requêtes quotidiennes, même lorsque ces sites ont clairement indiqué, via les fichiers robots.txt et d’autres mécanismes de blocage, que les bots IA n’étaient pas les bienvenus. L’enquête de Cloudflare affirme que les bots de Perplexity ont modifié les identifiants d’agent utilisateur pour se faire passer pour des navigateurs web courants comme Google Chrome sur macOS et ont fait pivoter les numéros de système autonome (ASNs) pour échapper à la détection. Cette pratique, affirme Cloudflare, sape le « gentlemen’s agreement » de longue date d’internet, où robots.txt sert de signal pour un comportement respectueux des bots.

La position de Cloudflare s’inscrit dans une initiative plus large visant à renforcer le pouvoir des créateurs de contenu et des éditeurs. En juillet 2025, l’entreprise a modifié sa politique pour bloquer par défaut la plupart des robots d’exploration IA pour les nouveaux domaines de son réseau, une mesure conçue pour protéger les producteurs de contenu contre la collecte de données non autorisée. Ils ont également lancé une place de marché « Pay Per Crawl », permettant aux éditeurs de facturer les entreprises d’IA pour un accès légitime à leur contenu, signalant un nouveau modèle économique pour le domaine numérique. Le PDG de Cloudflare, Matthew Prince, a exprimé ses inquiétudes quant au fait que le scraping IA incontrôlé représente une « menace existentielle » pour les éditeurs, qui voient leur trafic de référence réduit et leurs revenus publicitaires compromis lorsque leur contenu est consommé par des modèles IA sans compensation. Déjà, plus de 2,5 millions de sites web utilisant Cloudflare ont choisi de bloquer les robots d’exploration d’entraînement IA.

Perplexity AI, pour sa part, nie avec véhémence tout acte répréhensible, qualifiant les allégations de Cloudflare d’« embarrassantes », de « disqualifiantes » et de simple « argument de vente ». L’entreprise soutient que Cloudflare comprend fondamentalement mal la nature opérationnelle des assistants IA modernes. Perplexity affirme que ses bots sont des « agents pilotés par l’utilisateur » qui récupèrent dynamiquement du contenu en réponse à des requêtes spécifiques de l’utilisateur, plutôt que de parcourir aveuglément le web à la recherche de données d’entraînement. Ils soutiennent que si un utilisateur humain pouvait accéder au contenu, alors un bot agissant au nom de cet utilisateur devrait également pouvoir le faire. Perplexity a également signalé de prétendues erreurs techniques dans l’analyse de Cloudflare, y compris une attribution erronée du trafic provenant de services tiers. Ce n’est pas la première fois que Perplexity fait l’objet d’un examen minutieux concernant ses méthodes d’acquisition de données ; l’entreprise a déjà été accusée de scraping web contraire à l’éthique et de plagiat par des médias comme Wired et la BBC.

Ce choc entre Cloudflare et Perplexity met en lumière une tension critique émergente dans l’écosystème numérique : à qui appartient le vaste océan de données sur internet, et comment l’IA devrait-elle interagir avec lui ? L’essor d’agents IA sophistiqués, capables de naviguer de manière autonome sur le web et d’extraire des informations sans engagement humain traditionnel, menace de perturber les modèles économiques basés sur la publicité et l’engagement qui ont longtemps soutenu internet. À mesure que les modèles IA deviennent de plus en plus dépendants des informations en temps réel, les frontières traditionnelles entre l’exploration web légitime et la collecte de données non autorisée s’estompent. L’issue de cette « guerre des agents IA » façonnera probablement de nouveaux protocoles pour l’accès à l’IA, influencera le développement de nouveaux cadres juridiques et, en fin de compte, dictera la viabilité économique future des créateurs de contenu dans un monde de plus en plus médiatisé par l’IA.