分享

2025 年 12 月 17 日

利用 Gemini 3 Flash 提供实时深度伪造情报

Sarah Dolen

AI 启航基金

Zohaib Ahmed

Resemble AI 创始人兼首席执行官

Vishal Dharmadhikari

开发者解决方案工程师

Shopify 精选案例主图

Resemble AI 是生成式语音和深度伪造检测领域的领导者。随着深度伪造技术变得越来越复杂,受监管行业的企业客户需要的不仅仅是“真实”或“虚假”的二元标签,还需要立即了解内容被标记的原因。

为了弥合技术取证与人类理解之间的差距,Resemble AI 将 Gemini 3.0 Flash 集成到“Resemble Intelligence”中,该系统可将复杂的检测数据转换为自然语言说明,同时不会牺牲实时性能。

速度至关重要:从像素级分析到高级推理

无论是消费者试图验证热推视频,还是银行的语音代理对来电者进行身份验证,与欺诈性内容的较量都在几秒内完成。延迟可能会中断关键互动流程。传统上,检测模型会输出技术热图或概率得分,虽然这些信息很准确,但无法回答用户最迫切的问题:“为什么这可疑?”

为了近乎实时地提供这一关键的可解释性层,Resemble AI 构建了一条无缝流水线,将他们专有的 DETECT-3B Omni 模型与 Gemini 3.0 Flash 配对,以识别特定的操纵伪影,并生成包含丰富上下文的说明。此集成功能可实现比 2.5 Pro 快 4 倍的多模态分析,可分析原始技术输出,而不会减慢关键工作流程的速度。

所示操作步骤经过精简

Resemble AI 还将 Gemini 3 Flash 与其最新的开源语音转文本模型 Chatterbox 相结合,打造出响应时间不到一秒的互动式语音 AI 智能体。

扎实的情报:优先考虑取证完整性

Resemble AI 利用 Gemini 3.0 Flash 的先进推理能力,实现了更高标准的取证完整性。与之前的迭代相比,该系统生成的伪造制品减少了 25%,确保每项自动化说明都严格基于取证数据。

对于需要遵守监管要求的企业来说,这种准确性至关重要。为帮助企业应对欧盟《AI 法案》等全球透明度要求,Resemble AI 使用 Gemini 3 Flash 来帮助验证专有水印,并提供清晰可行的情报。

对于经过验证的语音代理,检测是实时进行的。如果通话被标记,Gemini 3 Flash 会立即生成摘要,说明所涉及的具体风险因素。这样一来,就可以实现顺畅的“人工接管”,确保客服人员在掌握完整上下文的情况下接管对话,而不是盲目接管。

Resemble AI 的实施表明,安全性和速度不必相互妥协。通过在其检测报告中添加可解释性层,他们帮助企业获得采取行动应对深度伪造所需的智能,而不仅仅是检测它们。

如需开始使用 Gemini 模型进行构建,请参阅我们的 API 文档,或在 Google AI Studio 中试用该模型。