分享

2025 年 12 月 17 日

運用 Gemini 3 Flash 提供即時深偽智慧

Sarah Dolen

AI 未來基金

Zohaib Ahmed

Resemble AI 創辦人兼執行長

Vishal Dharmadhikari

開發人員解決方案工程師

Shopify 展示主頁橫幅

Resemble AI 是生成語音和深偽偵測領域的領導者。隨著深偽技術日益精進,受監管產業的企業客戶不僅需要「真實」或「偽造」的二元標籤,還需要立即瞭解內容遭到標記的原因。

為縮小技術鑑識與人類理解之間的差距,Resemble AI 將 Gemini 3.0 Flash 整合至「Resemble Intelligence」,這個系統可將複雜的偵測資料轉換為自然語言說明,同時維持即時效能。

速度至關重要:從像素層級分析到高階推理

無論是消費者想驗證爆紅影片,還是銀行語音服務專員要驗證來電者身分,都必須在幾秒內與詐欺內容賽跑。延遲可能會中斷重要互動流程。傳統的偵測模型會輸出技術熱感應圖或機率分數,雖然準確,但無法回答使用者最迫切的問題:「為什麼這項活動可疑?」

為近乎即時地提供這項重要的可解釋性層級,Resemble AI 打造了無縫管道,將專屬的 DETECT-3B Omni 模型與 Gemini 3.0 Flash 配對,前者可找出特定操弄偽影,後者則可生成內容豐富的說明。這項整合功能可分析原始技術輸出內容,不會拖慢重要工作流程,且多模態分析速度比 2.5 Pro 快 4 倍。

介面程序為精簡步驟

Resemble AI 也將 Gemini 3 Flash 與最新的開放原始碼文字轉語音模型 Chatterbox 配對,打造互動式語音 AI 代理程式,回應時間不到一秒。

以事實為依據的情報:優先確保鑑識完整性

Resemble AI 運用 Gemini 3.0 Flash 的進階推論能力,達到更高的鑑識完整性標準。與先前的疊代版本相比,系統產生的偽造物減少了 25%,確保每項自動說明都嚴格根據鑑識資料。

對於需要遵守法規要求的商家來說,這項準確度至關重要。為協助企業遵守全球透明度規定 (例如歐盟 AI 法案),Resemble AI 使用 Gemini 3 Flash 驗證專屬浮水印,並提供明確可行的情報。

如果是已驗證的語音代理人,系統會即時偵測。如果通話遭到標記,Gemini 3 Flash 會立即生成摘要,說明涉及的具體風險因素。這樣一來,就能順利「交接」,確保操作人員接手時能掌握完整脈絡,而不是毫無頭緒。

Resemble AI 的實作方式證明,安全性和速度不必有所取捨。他們在偵測報告中加入可解釋性層級,協助企業取得所需情報,以便對深偽技術採取行動,而不只是偵測。

如要開始使用 Gemini 模型建構內容,請參閱 API 說明文件,或在 Google AI Studio 中試用模型。