AI欺诈浪潮下，深度伪造检测技术如何应对挑战？

近期在拉斯维加斯举行的多场安全会议，包括BSides、Black Hat和DEF CON，共同凸显了一个普遍的担忧：欺诈威胁日益加剧，而人工智能的进步则使其影响显著放大。随着AI工具成本的骤降和深度伪造技术的日益复杂，专家们预计数字欺骗将急剧增加。例如，德勤（Deloitte）预测，到2027年，深度伪造欺诈可能给美国经济造成高达400亿美元的损失，而安全界许多人认为这一估计仍属保守。这一令人警觉的趋势紧随行业领袖的言论之后，如萨姆·奥尔特曼（Sam Altman）曾有争议地提出，除了密码之外，AI已有效绕过大多数传统身份验证方法。

尽管深度伪造检测软件市场正在蓬勃发展，但这些工具的有效性仍是争议的焦点。卡尔蒂克·塔迪纳达（Karthik Tadinada）曾为英国主要银行Featurespace监测欺诈十余年，他指出，反深度伪造技术在识别欺诈活动和消除误报方面通常能达到90%左右的准确率。虽然看似很高，但这10%的误差空间为犯罪分子提供了巨大机会，尤其是在生成虚假身份的成本持续下降的情况下。正如塔迪纳达所说：“生成这些东西的经济成本与你能检测和处理的成本相比，实际上那10%的利润空间仍然足够大。”

视频冒充虽然早于AI出现，但已被机器学习大大增强。塔迪纳达和前Featurespace同事马丁·希格森（Martyn Higson）通过将英国首相基尔·斯塔默（Keir Starmer）的脸无缝叠加到希格森的身体上，并配以令人信服的模仿声音，仅用一台MacBook Pro就实现了这一点。尽管这个特定例子还不足以绕过高级深度伪造检测系统——AI生成的面孔通常会表现出不自然的浮肿下巴或僵硬外观等明显特征——但它足以用于传播宣传或虚假信息。最近的一起事件印证了这一点：记者克里斯·库默（Chris Cuomo）曾短暂发布随后又撤回了一段美国众议员亚历山大·奥卡西奥-科尔特斯（Alexandria Ocasio-Cortez）发表争议言论的深度伪造视频。

媒体监测公司Silent Signals的红队负责人迈克·拉戈（Mike Raggo）也同意视频伪造的质量已大幅提高。然而，他也指出了一些有望实现更有效检测的新兴技术。例如，Silent Signals与OpenAI的GPT-5合作推出了免费的基于Python的工具Fake Image Forensic Examiner v1.1。该工具逐帧分析上传的视频，仔细寻找操纵迹象，例如物体边缘的模糊或背景元素的异常。至关重要的是，检查元数据（metadata）是首要任务，因为许多视频操纵工具，无论是商业的还是开源的，都会无意中在文件代码中留下数字痕迹，而强大的检测引擎可以识别这些痕迹。

除了视频，图像可能是欺诈者最关注的载体，因为它们易于创建且企业日益依赖它们。塔迪纳达在银行业的经验凸显了电子记录的脆弱性，尤其是在COVID-19大流行期间，面对面银行服务减少。例如，在英国开设银行账户通常需要有效的身份证件和近期水电费账单，塔迪纳达演示了这两者都可以轻松伪造，并且难以进行电子验证。虽然拉戈在Black Hat会议上观察到了一些有前景的深度伪造检测解决方案，但他强调任何有效的工具都必须优先考虑元数据分析——寻找缺失的国际色彩联盟（ICC）配置文件（与色彩平衡相关的数字签名）或特定供应商的元数据，例如谷歌在安卓图像文件中嵌入“Google Inc”的习惯。此外，边缘分析（检查物体边界的模糊或亮度不一致）和像素差异（测量物体内部的颜色变化）也是至关重要的技术。

然而，检测语音深度伪造面临着一系列不同的挑战，并且这些语音攻击正在增加。5月，联邦调查局（FBI）发布警告，称一起欺诈活动利用AI生成的美国政客声音来诱骗个人授予访问政府系统以获取经济利益。联邦调查局的建议，值得注意的是非技术性的，敦促用户独立验证来源并留意词汇或口音中的细微不一致，承认区分AI生成内容的难度越来越大。同样，联邦贸易委员会（Federal Trade Commission）赞助的一项为期一年的AI生成语音检测竞赛仅提供了3.5万美元的奖金，这反映了该检测领域仍处于萌芽阶段。

虽然语音克隆技术有合法应用，如转录、媒体配音和增强呼叫中心机器人——例如微软的Azure AI语音，仅需几秒钟的音频就能生成令人信服的语音克隆，尽管水印不完善——但它们也是欺诈者的强大工具。消费者报告（Consumer Reports）对六项语音克隆服务进行的一项研究发现，三分之二的服务在防止滥用方面几乎没有努力，通常只需简单勾选确认合法克隆语音的权利。在测试中，只有一家公司Resemble AI要求提供实时音频片段，但即使这样有时也可能被录音欺骗，尽管由于音质问题准确性会降低。许多语音克隆公司，包括Resemble AI，现在正在将其深度伪造检测集成到其产品中。Resemble首席执行官佐海布·艾哈迈德（Zohaib Ahmed）解释说，他们庞大的真实和克隆语音数据库提供了宝贵的见解，使他们能够识别出人耳无法察觉的细微“伪影”，从而区分真假。

最终，就像传统网络安全一样，深度伪造检测没有万无一失的技术解决方案。人为因素仍然至关重要。Sophos的红队负责人埃里克·埃斯科巴（Eric Escobar）建议“保持警惕”，并强调“验证是绝对关键的，特别是如果涉及金钱”。他敦促个人询问“这符合其本人特点吗？”并在不确定时进行双重检查。塔迪纳达为金融行业重申了这一点，强调除了深度伪造扫描，金融交易本身也必须像其他欺诈检测方法一样，监测可疑模式。

生成对抗网络（GANs）使这场不断升级的军备竞赛变得更加复杂，它采用两个相互竞争的AI引擎——一个生成媒体，另一个试图识别制造的内容——以迭代地提高深度伪造的真实感。虽然当前的GANs可能会在元数据中留下可识别的签名，但该技术有望带来更具说服力的结果，不可避免地导致更多成功的欺诈行为。

AI欺诈浪潮下，深度伪造检测技术如何应对挑战？

相关文章

普通劳动者揭示AI的实用价值：它不只是威胁

北卡学区举办学生“提示马拉松”，提升AI素养

网络安全专家Black Hat大会首要担忧：AI、深度伪造与人为错误