利用 Gemini 3 Flash 提供实时深度伪造情报

Sarah Dolen

AI 启航基金

Zohaib Ahmed

Resemble AI 创始人兼首席执行官

Vishal Dharmadhikari

开发者解决方案工程师

Resemble AI 是生成式语音和深度伪造检测领域的领导者。随着深度伪造技术变得越来越复杂，受监管行业的企业客户需要的不仅仅是“真实”或“虚假”的二元标签，还需要立即了解内容被标记的原因。

为了弥合技术取证与人类理解之间的差距，Resemble AI 将 Gemini 3.0 Flash 集成到“Resemble Intelligence”中，该系统可将复杂的检测数据转换为自然语言说明，同时不会牺牲实时性能。

速度至关重要：从像素级分析到高级推理

无论是消费者试图验证热推视频，还是银行的语音代理对来电者进行身份验证，与欺诈性内容的较量都在几秒内完成。延迟可能会中断关键互动流程。传统上，检测模型会输出技术热图或概率得分，虽然这些信息很准确，但无法回答用户最迫切的问题：“为什么这可疑？”

为了近乎实时地提供这一关键的可解释性层，Resemble AI 构建了一条无缝流水线，将他们专有的 DETECT-3B Omni 模型与 Gemini 3.0 Flash 配对，以识别特定的操纵伪影，并生成包含丰富上下文的说明。此集成功能可实现比 2.5 Pro 快 4 倍的多模态分析，可分析原始技术输出，而不会减慢关键工作流程的速度。

所示操作步骤经过精简

Resemble AI 还将 Gemini 3 Flash 与其最新的开源语音转文本模型 Chatterbox 相结合，打造出响应时间不到一秒的互动式语音 AI 智能体。

扎实的情报：优先考虑取证完整性

Resemble AI 利用 Gemini 3.0 Flash 的先进推理能力，实现了更高标准的取证完整性。与之前的迭代相比，该系统生成的伪造制品减少了 25%，确保每项自动化说明都严格基于取证数据。

对于需要遵守监管要求的企业来说，这种准确性至关重要。为帮助企业应对欧盟《AI 法案》等全球透明度要求，Resemble AI 使用 Gemini 3 Flash 来帮助验证专有水印，并提供清晰可行的情报。

对于经过验证的语音代理，检测是实时进行的。如果通话被标记，Gemini 3 Flash 会立即生成摘要，说明所涉及的具体风险因素。这样一来，就可以实现顺畅的“人工接管”，确保客服人员在掌握完整上下文的情况下接管对话，而不是盲目接管。

Resemble AI 的实施表明，安全性和速度不必相互妥协。通过在其检测报告中添加可解释性层，他们帮助企业获得采取行动应对深度伪造所需的智能，而不仅仅是检测它们。

如需开始使用 Gemini 模型进行构建，请参阅我们的 API 文档，或在 Google AI Studio 中试用该模型。

利用 Gemini 3 Flash 提供实时深度伪造情报

速度至关重要：从像素级分析到高级推理

扎实的情报：优先考虑取证完整性

相关案例研究