AI欺诈浪潮下,深度伪造检测技术如何应对挑战?

Theregister

近期在拉斯维加斯举行的多场安全会议,包括BSides、Black Hat和DEF CON,共同凸显了一个普遍的担忧:欺诈威胁日益加剧,而人工智能的进步则使其影响显著放大。随着AI工具成本的骤降和深度伪造技术的日益复杂,专家们预计数字欺骗将急剧增加。例如,德勤(Deloitte)预测,到2027年,深度伪造欺诈可能给美国经济造成高达400亿美元的损失,而安全界许多人认为这一估计仍属保守。这一令人警觉的趋势紧随行业领袖的言论之后,如萨姆·奥尔特曼(Sam Altman)曾有争议地提出,除了密码之外,AI已有效绕过大多数传统身份验证方法。

尽管深度伪造检测软件市场正在蓬勃发展,但这些工具的有效性仍是争议的焦点。卡尔蒂克·塔迪纳达(Karthik Tadinada)曾为英国主要银行Featurespace监测欺诈十余年,他指出,反深度伪造技术在识别欺诈活动和消除误报方面通常能达到90%左右的准确率。虽然看似很高,但这10%的误差空间为犯罪分子提供了巨大机会,尤其是在生成虚假身份的成本持续下降的情况下。正如塔迪纳达所说:“生成这些东西的经济成本与你能检测和处理的成本相比,实际上那10%的利润空间仍然足够大。”

视频冒充虽然早于AI出现,但已被机器学习大大增强。塔迪纳达和前Featurespace同事马丁·希格森(Martyn Higson)通过将英国首相基尔·斯塔默(Keir Starmer)的脸无缝叠加到希格森的身体上,并配以令人信服的模仿声音,仅用一台MacBook Pro就实现了这一点。尽管这个特定例子还不足以绕过高级深度伪造检测系统——AI生成的面孔通常会表现出不自然的浮肿下巴或僵硬外观等明显特征——但它足以用于传播宣传或虚假信息。最近的一起事件印证了这一点:记者克里斯·库默(Chris Cuomo)曾短暂发布随后又撤回了一段美国众议员亚历山大·奥卡西奥-科尔特斯(Alexandria Ocasio-Cortez)发表争议言论的深度伪造视频。

媒体监测公司Silent Signals的红队负责人迈克·拉戈(Mike Raggo)也同意视频伪造的质量已大幅提高。然而,他也指出了一些有望实现更有效检测的新兴技术。例如,Silent Signals与OpenAI的GPT-5合作推出了免费的基于Python的工具Fake Image Forensic Examiner v1.1。该工具逐帧分析上传的视频,仔细寻找操纵迹象,例如物体边缘的模糊或背景元素的异常。至关重要的是,检查元数据(metadata)是首要任务,因为许多视频操纵工具,无论是商业的还是开源的,都会无意中在文件代码中留下数字痕迹,而强大的检测引擎可以识别这些痕迹。

除了视频,图像可能是欺诈者最关注的载体,因为它们易于创建且企业日益依赖它们。塔迪纳达在银行业的经验凸显了电子记录的脆弱性,尤其是在COVID-19大流行期间,面对面银行服务减少。例如,在英国开设银行账户通常需要有效的身份证件和近期水电费账单,塔迪纳达演示了这两者都可以轻松伪造,并且难以进行电子验证。虽然拉戈在Black Hat会议上观察到了一些有前景的深度伪造检测解决方案,但他强调任何有效的工具都必须优先考虑元数据分析——寻找缺失的国际色彩联盟(ICC)配置文件(与色彩平衡相关的数字签名)或特定供应商的元数据,例如谷歌在安卓图像文件中嵌入“Google Inc”的习惯。此外,边缘分析(检查物体边界的模糊或亮度不一致)和像素差异(测量物体内部的颜色变化)也是至关重要的技术。

然而,检测语音深度伪造面临着一系列不同的挑战,并且这些语音攻击正在增加。5月,联邦调查局(FBI)发布警告,称一起欺诈活动利用AI生成的美国政客声音来诱骗个人授予访问政府系统以获取经济利益。联邦调查局的建议,值得注意的是非技术性的,敦促用户独立验证来源并留意词汇或口音中的细微不一致,承认区分AI生成内容的难度越来越大。同样,联邦贸易委员会(Federal Trade Commission)赞助的一项为期一年的AI生成语音检测竞赛仅提供了3.5万美元的奖金,这反映了该检测领域仍处于萌芽阶段。

虽然语音克隆技术有合法应用,如转录、媒体配音和增强呼叫中心机器人——例如微软的Azure AI语音,仅需几秒钟的音频就能生成令人信服的语音克隆,尽管水印不完善——但它们也是欺诈者的强大工具。消费者报告(Consumer Reports)对六项语音克隆服务进行的一项研究发现,三分之二的服务在防止滥用方面几乎没有努力,通常只需简单勾选确认合法克隆语音的权利。在测试中,只有一家公司Resemble AI要求提供实时音频片段,但即使这样有时也可能被录音欺骗,尽管由于音质问题准确性会降低。许多语音克隆公司,包括Resemble AI,现在正在将其深度伪造检测集成到其产品中。Resemble首席执行官佐海布·艾哈迈德(Zohaib Ahmed)解释说,他们庞大的真实和克隆语音数据库提供了宝贵的见解,使他们能够识别出人耳无法察觉的细微“伪影”,从而区分真假。

最终,就像传统网络安全一样,深度伪造检测没有万无一失的技术解决方案。人为因素仍然至关重要。Sophos的红队负责人埃里克·埃斯科巴(Eric Escobar)建议“保持警惕”,并强调“验证是绝对关键的,特别是如果涉及金钱”。他敦促个人询问“这符合其本人特点吗?”并在不确定时进行双重检查。塔迪纳达为金融行业重申了这一点,强调除了深度伪造扫描,金融交易本身也必须像其他欺诈检测方法一样,监测可疑模式。

生成对抗网络(GANs)使这场不断升级的军备竞赛变得更加复杂,它采用两个相互竞争的AI引擎——一个生成媒体,另一个试图识别制造的内容——以迭代地提高深度伪造的真实感。虽然当前的GANs可能会在元数据中留下可识别的签名,但该技术有望带来更具说服力的结果,不可避免地导致更多成功的欺诈行为。