智能力量:AI新星挑战网络规则,守门人发起“网络之战”
当前,数字领域正被一场被称为“网络之战”的日益升级的冲突所笼罩。著名的互联网“守门人”Cloudflare公开指责新兴AI明星Perplexity AI系统性地违反了互联网的基本规则。这场由Gizmodo重点报道的爆炸性争端,可能重新定义在线信息的访问和报酬方式,对出版商、AI开发者和用户都将产生深远影响。
这场争议的核心是互联网基础设施巨头Cloudflare提出的指控,称Perplexity AI参与了“隐秘抓取”策略。Cloudflare声称,Perplexity的自动化系统或机器人,正在故意规避robots.txt
文件——这是网站用来指示哪些内容可以被抓取和索引的数字“禁止进入”标志。根据Cloudflare的分析,Perplexity的爬虫不仅无视这些明确的指令,而且还通过更改用户代理、轮换IP地址和转换自治系统号(ASN)来伪装身份,以逃避检测并违背网站所有者的意愿访问内容。Cloudflare本周早些时候发布的报告详细说明了这些机器人如何模仿合法的浏览器流量,并在被阻止时调整其方法,就像适应性恶意软件一样。
Perplexity AI是一家由知名投资者支持的AI驱动搜索应用,它强烈否认了Cloudflare的指控。Perplexity的一位发言人驳斥Cloudflare的博客文章是“推销手段”,并辩称Cloudflare识别出的机器人并非他们所有,或者它并未访问任何内容。Perplexity坚称,其AI助手是作为“用户触发代理”运作的,它们根据用户请求实时检索信息,类似于人类浏览网页,而不是为了模型训练而进行不加区分的大规模抓取。他们认为Cloudflare可能误解了现代AI驱动信息检索的细微之处。
这场冲突象征着数字生态系统中正在酝酿的更广泛的紧张局势。出版商和内容创作者对AI公司未经同意或补偿就摄取大量网络数据来训练其大型语言模型(LLM)的行为,越来越强烈地表达了对其知识产权被剥削的看法。IAB Tech Lab最近在纽约召集了80多位媒体高管的会议,突显了这种日益增长的抵制,来自Google和Meta的代表也加入了呼吁制定新框架来管理AI内容访问的行列。此次峰会旨在开发一个LLM内容摄取API,以强制执行出版商的同意,从而超越许多AI公司据称已无视的自愿性指导方针。
事实上,这场争议已超出Perplexity的范畴。有报道浮出水面,揭露Meta系统性地抓取了约600万个独立网站来训练其AI模型,据称绕过了保护协议,从包括新闻机构和受版权保护材料在内的各种来源收集内容。Cloudflare本身在这一不断演变的环境中也一直积极主动,已于2025年7月推出了一项“按次爬取付费”服务,允许内容创作者向AI爬虫收取访问费用,并提供一个完全阻止AI机器人的免费工具。
“网络之战”最终是一场关于控制权、报酬以及在人工智能时代对合理使用定义之争。随着AI模型变得越来越复杂和数据饥渴,Cloudflare和Perplexity之间这场争议的结果,以及由此引发的更广泛的行业讨论,无疑将塑造在线内容的未来经济模式和管理互联网的基本规则。法律专家正密切关注这些发展,因为它们可能考验现有法律的边界,并加速制定AI数据实践新伦理和技术标准的需要。