Guerra de agentes IA: Cloudflare vs. Perplexity redefine la economía web

Fastcompany

La frontera digital es de nuevo un campo de batalla, esta vez enfrentando a un titán de la infraestructura de internet contra una fuerza emergente en inteligencia artificial. Cloudflare, la empresa que protege una parte significativa de la web, ha marcado una línea definitiva contra Perplexity AI, acusando al motor de búsqueda impulsado por IA de emplear “tácticas sigilosas” para eludir las instrucciones explícitas de los propietarios de sitios web para bloquear la recopilación de datos. Este conflicto creciente es más que una disputa corporativa; representa un momento crucial que podría redefinir fundamentalmente la economía de la web y la propia naturaleza de la propiedad del contenido digital.

En el centro de la disputa, Cloudflare alega que Perplexity AI ha estado utilizando rastreadores web no declarados y disfrazados para acceder a contenido de decenas de miles de dominios, generando millones de solicitudes diarias, incluso cuando esos sitios han indicado claramente, a través de archivos robots.txt y otros mecanismos de bloqueo, que los bots de IA no son bienvenidos. La investigación de Cloudflare afirma que los bots de Perplexity alteraron los identificadores de agente de usuario para hacerse pasar por navegadores web comunes como Google Chrome en macOS y rotaron los números de sistema autónomo (ASNs) para evadir la detección. Esta práctica, según Cloudflare, socava el “acuerdo de caballeros” de larga data de internet, donde robots.txt sirve como señal para un comportamiento respetuoso de los bots.

La postura de Cloudflare se basa en una iniciativa más amplia para empoderar a los creadores de contenido y editores. En julio de 2025, la compañía cambió su política para bloquear por defecto la mayoría de los rastreadores de IA para nuevos dominios en su red, una medida diseñada para proteger a los productores de contenido de la recolección de datos no autorizada. También lanzaron un mercado de “Pago por Rastreo” (Pay Per Crawl), permitiendo a los editores cobrar a las empresas de IA por el acceso legítimo a su contenido, señalando un nuevo modelo económico para el ámbito digital. El CEO de Cloudflare, Matthew Prince, ha expresado su preocupación de que el scraping de IA sin control representa una “amenaza existencial” para los editores, quienes enfrentan una reducción del tráfico de referencia y una disminución de los ingresos publicitarios cuando su contenido es consumido por modelos de IA sin compensación. Ya, más de 2.5 millones de sitios web que utilizan Cloudflare han optado por bloquear los rastreadores de entrenamiento de IA.

Perplexity AI, por su parte, niega vehementemente cualquier irregularidad, calificando las afirmaciones de Cloudflare como “embarazosas”, “descalificadoras” y una mera “propuesta de venta”. La compañía sostiene que Cloudflare malinterpreta fundamentalmente la naturaleza operativa de los asistentes de IA modernos. Perplexity argumenta que sus bots son “agentes impulsados por el usuario” que obtienen contenido dinámicamente en respuesta a consultas específicas del usuario, en lugar de rastrear indiscriminadamente la web en busca de datos de entrenamiento. Sostienen que si un usuario humano pudiera acceder al contenido, entonces un bot que actúe en nombre de ese usuario también debería poder hacerlo. Perplexity también ha señalado supuestos errores técnicos en el análisis de Cloudflare, incluida la atribución errónea de tráfico de servicios de terceros. Esta no es la primera vez que Perplexity se enfrenta a un escrutinio por sus métodos de adquisición de datos; la compañía ha sido acusada previamente de scraping web poco ético y plagio por medios de comunicación como Wired y la BBC.

Este enfrentamiento entre Cloudflare y Perplexity ilumina una tensión crítica que emerge en el ecosistema digital: ¿quién es el propietario del vasto océano de datos en internet, y cómo debería interactuar la IA con él? El auge de agentes de IA sofisticados, capaces de navegar por la web de forma autónoma y extraer información sin la participación humana tradicional, amenaza con alterar los modelos económicos impulsados por la publicidad y el compromiso que han sustentado internet durante mucho tiempo. A medida que los modelos de IA dependen cada vez más de la información en tiempo real, los límites tradicionales entre el rastreo web legítimo y la recolección de datos no autorizada se están difuminando. El resultado de esta “guerra de agentes de IA” probablemente dará forma a nuevos protocolos para el acceso de la IA, influirá en el desarrollo de nuevos marcos legales y, en última instancia, dictará la viabilidad económica futura para los creadores de contenido en un mundo cada vez más mediado por la IA.