Gemini 3 Flash によるリアルタイムのディープフェイクインテリジェンス

Sarah Dolen

AI Futures Fund

Zohaib Ahmed

Resemble AI、創業者兼 CEO

Vishal Dharmadhikari

デベロッパーソリューションエンジニア

Resemble AI は、音声生成とディープフェイク検出のリーダーです。ディープフェイクの高度化に伴い、規制対象業界の企業クライアントは「本物」か「偽物」かの二元的なラベルだけでなく、コンテンツがフラグ付けされた理由を即座に理解する必要があります。

技術的なフォレンジックと人間の理解のギャップを埋めるため、Resemble AI は Gemini 3.0 Flash を「Resemble Intelligence」に統合しました。これは、リアルタイムパフォーマンスを犠牲にすることなく、複雑な検出データを自然言語の説明に変換するシステムです。

スピードがすべて: ピクセルレベルの分析から高度な推論まで

消費者がバイラル動画の真偽を確認しようとしている場合でも、銀行の音声エージェントが発信者を認証しようとしている場合でも、不正なコンテンツとの戦いは数秒で決着します。レイテンシは重要なインタラクションのフローを中断させる可能性があります。従来、検出モデルは技術的なヒートマップや確率スコアを出力していましたが、これらは正確ではあるものの、ユーザーが最も知りたい「なぜこれが疑わしいのか」という疑問に答えることができませんでした。

この説明可能性の重要なレイヤをほぼリアルタイムで提供するために、Resemble AI は、独自の DETECT-3B Omni モデルと Gemini 3.0 Flash を組み合わせて特定の改ざんアーティファクトを特定し、コンテキストが豊富な説明を生成するシームレスなパイプラインを構築しました。この統合により、2.5 Pro よりも 4 倍高速なマルチモーダル分析が可能になり、重要なワークフローを遅延させることなく、未加工の技術出力を分析できます。

操作過程の一部は省略しています

Resemble AI は、Gemini 3 Flash と最新のオープンソースのテキスト読み上げモデル Chatterbox を組み合わせて、応答時間が 1 秒未満のインタラクティブな音声 AI エージェントを実現しています。

根拠のあるインテリジェンス: フォレンジックの完全性を優先する

Resemble AI は、Gemini 3.0 Flash の高度な推論を活用して、より高い水準のフォレンジックの完全性を実現します。このシステムでは、以前のイテレーションよりも偽造されたアーティファクトが 25% 削減され、すべての自動説明がフォレンジックデータに厳密に基づいたものになります。

この精度は、規制要件の遵守を必要とする企業にとって重要です。企業が EU AI 法などのグローバルな透明性に関する義務を遵守できるよう、Resemble AI は Gemini 3 Flash を使用して独自のウォーターマークを検証し、明確で実用的なインテリジェンスを提供しています。

確認済みの音声エージェントの場合、検出はリアルタイムで行われます。通話にフラグが付けられると、Gemini 3 Flash は関連する特定のリスク要因を説明する要約を即座に生成します。これにより、オペレーターが状況を完全に把握した状態で引き継ぐことができるため、スムーズな「人間の引き継ぎ」が可能になります。

Resemble AI の実装は、安全性と速度がトレードオフである必要がないことを示しています。検出レポートに説明可能性のレイヤを追加することで、企業がディープフェイクを検出するだけでなく、それに対処するために必要なインテリジェンスを提供しています。

Gemini モデルでの構築を開始するには、API ドキュメントをご覧になるか、Google AI Studio でモデルをお試しください。

Gemini 3 Flash によるリアルタイムのディープフェイク インテリジェンス

スピードがすべて: ピクセルレベルの分析から高度な推論まで

根拠のあるインテリジェンス: フォレンジックの完全性を優先する

関連事例

Gemini 3 Flash によるリアルタイムのディープフェイクインテリジェンス