KI-Agenten-Krieg: Cloudflare vs. Perplexity definiert Web-Wirtschaft neu

Fastcompany

Die digitale Grenze ist wieder einmal ein Schlachtfeld, diesmal treten ein Gigant der Internet-Infrastruktur und eine aufstrebende Kraft im Bereich der künstlichen Intelligenz gegeneinander an. Cloudflare, das Unternehmen, das einen erheblichen Teil des Webs schützt, hat eine klare Grenze gegenüber Perplexity AI gezogen. Es wirft der KI-gestützten Suchmaschine vor, „heimliche Taktiken“ anzuwenden, um explizite Anweisungen von Website-Betreibern zur Blockierung der Datenerfassung zu umgehen. Dieser eskalierende Konflikt ist mehr als nur ein Unternehmensstreit; er stellt einen entscheidenden Moment dar, der die Wirtschaft des Webs und das Wesen des digitalen Content-Eigentums grundlegend neu definieren könnte.

Im Mittelpunkt des Streits behauptet Cloudflare, dass Perplexity AI nicht deklarierte und getarnte Web-Crawler verwendet hat, um auf Inhalte von Zehntausenden von Domains zuzugreifen und täglich Millionen von Anfragen zu generieren, selbst wenn diese Websites über robots.txt-Dateien und andere Blockierungsmechanismen klar angegeben haben, dass KI-Bots unerwünscht sind. Cloudflares Untersuchung behauptet, dass Perplexity-Bots Benutzer-Agent-Identifikatoren geändert haben, um sich als gängige Webbrowser wie Google Chrome unter macOS auszugeben, und Autonome Systemnummern (ASNs) rotiert haben, um die Erkennung zu umgehen. Diese Praxis, so Cloudflare, untergräbt das langjährige „Gentlemen’s Agreement“ des Internets, bei dem robots.txt als Signal für respektvolles Bot-Verhalten dient.

Cloudflares Haltung wurzelt in einer breiteren Initiative zur Stärkung von Content-Erstellern und Publishern. Im Juli 2025 änderte das Unternehmen seine Richtlinien, um die meisten KI-Crawler für neue Domains in seinem Netzwerk standardmäßig zu blockieren. Diese Maßnahme soll Content-Produzenten vor unbefugter Datenernte schützen. Sie starteten auch einen „Pay Per Crawl“-Marktplatz, der es Publishern ermöglicht, KI-Firmen für den legitimen Zugang zu ihren Inhalten Gebühren zu berechnen, was ein neues Wirtschaftsmodell für den digitalen Bereich signalisiert. Cloudflare CEO Matthew Prince hat Bedenken geäußert, dass unkontrolliertes KI-Scraping eine „existenzielle Bedrohung“ für Publisher darstellt, die mit reduziertem Verweisverkehr und untergrabenen Werbeeinnahmen konfrontiert sind, wenn ihre Inhalte von KI-Modellen ohne Vergütung konsumiert werden. Bereits über 2,5 Millionen Websites, die Cloudflare nutzen, haben sich dafür entschieden, KI-Trainings-Crawler zu blockieren.

Perplexity AI seinerseits bestreitet vehement jegliches Fehlverhalten und weist Cloudflares Behauptungen als „peinlich“, „disqualifizierend“ und lediglich als „Verkaufsgespräch“ zurück. Das Unternehmen behauptet, dass Cloudflare die Funktionsweise moderner KI-Assistenten grundlegend missversteht. Perplexity argumentiert, dass seine Bots „benutzergesteuerte Agenten“ sind, die Inhalte dynamisch als Reaktion auf spezifische Benutzeranfragen abrufen, anstatt das Web wahllos nach Trainingsdaten zu durchsuchen. Sie behaupten, dass, wenn ein menschlicher Benutzer auf den Inhalt zugreifen könnte, ein Bot, der im Namen dieses Benutzers handelt, dies ebenfalls tun können sollte. Perplexity hat auch auf angebliche technische Fehler in Cloudflares Analyse hingewiesen, einschließlich der falschen Zuordnung von Traffic von Drittanbieterdiensten. Dies ist nicht das erste Mal, dass Perplexity wegen seiner Datenerfassungsmethoden unter die Lupe genommen wird; das Unternehmen wurde zuvor von Medien wie Wired und der BBC des unethischen Web-Scrapings und Plagiats beschuldigt.

Dieser Konflikt zwischen Cloudflare und Perplexity beleuchtet eine kritische Spannung, die im digitalen Ökosystem entsteht: Wem gehört der riesige Datenozean im Internet, und wie sollte KI damit interagieren? Der Aufstieg hochentwickelter KI-Agenten, die in der Lage sind, das Web autonom zu navigieren und Informationen ohne traditionelle menschliche Beteiligung zu extrahieren, droht die Werbe- und Engagement-getriebenen Wirtschaftsmodelle zu stören, die das Internet lange Zeit untermauert haben. Da KI-Modelle zunehmend auf Echtzeitinformationen angewiesen sind, verschwimmen die traditionellen Grenzen zwischen legitimen Web-Crawling und unbefugter Datenerfassung. Das Ergebnis dieses „KI-Agenten-Krieges“ wird wahrscheinlich neue Protokolle für den KI-Zugriff formen, die Entwicklung neuer rechtlicher Rahmenbedingungen beeinflussen und letztendlich die zukünftige wirtschaftliche Rentabilität für Content-Ersteller in einer zunehmend KI-vermittelten Welt bestimmen.