Gemini 3.1 Flash Live Preview は、低レイテンシの音声対音声モデルです。音響ニュアンス検出、数値精度、マルチモーダル認識を備え、リアルタイムの対話や音声優先の AI アプリケーション向けに最適化されています。
ドキュメント
機能と性能の詳細については、Live API ガイドをご覧ください。
gemini-3.1-flash-live-preview
| プロパティ | 説明 |
|---|---|
| モデルコード |
gemini-3.1-flash-live-preview
|
| サポートされているデータ型 |
入力 テキスト、画像、音声、動画 出力 テキストと音声 |
| トークン上限[*] |
入力トークンの上限 131,072 出力トークンの上限 65,536 |
| 機能 |
音声生成 サポート対象 Batch API サポート対象外 キャッシュ保存 サポート対象外 コードの実行 サポート対象外 ファイル検索 サポート対象外 関数呼び出し サポート対象 Google マップによるグラウンディング サポート対象外 画像生成 サポート対象外 Live API サポート対象 検索によるグラウンディング サポート対象 構造化出力 サポート対象外 思考モード サポート対象 URL コンテキスト サポート対象外 |
| バージョン |
|
| 最終更新日 | 2026 年 3 月 |
| ナレッジ カットオフ | 2025 年 1 月 |
Gemini 2.5 Flash Live からの移行
Gemini 3.1 Flash Live Preview は、低レイテンシのリアルタイム対話向けに最適化されています。
gemini-2.5-flash-native-audio-preview-12-2025 から移行する場合は、次の点を考慮してください。
- モデル文字列: モデル文字列を
gemini-2.5-flash-native-audio-preview-12-2025からgemini-3.1-flash-live-previewに更新します。 - 思考構成: Gemini 3.1 では、
thinkingBudgetではなくthinkingLevel(minimal、low、medium、highなどの設定)を使用します。デフォルトはminimalで、レイテンシを最小限に抑えるように最適化されています。思考レベルと予算をご覧ください。 - サーバー イベント: 1 つの
BidiGenerateContentServerContentイベントに、複数のコンテンツ部分(たとえば、 音声チャンクや文字起こし)を同時に含めることができるようになりました。コンテンツが欠落しないように、各イベントのすべての部分を処理するようにコードを更新してください。 - クライアント コンテンツ:
send_client_contentは、初期コンテキスト履歴のシード処理でのみサポートされています(initial_history_in_client_contentでhistory_configを設定する必要があります)。会話中に テキストの更新を送信するには、send_realtime_inputを使用します。コンテンツの増分更新をご覧ください。 - ターン カバレッジ: デフォルトは
TURN_INCLUDES_ONLY_ACTIVITYではなくTURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOになりました。モデルのターンには、検出された音声アクティビティとすべての動画フレームが含まれるようになりました。アプリケーションが現在、動画フレームの定常的なストリームを送信している場合は、追加費用が発生しないように、音声アクティビティがある場合にのみ動画フレームを送信するようにアプリケーションを更新することをおすすめします。 - 非同期関数呼び出し: まだサポートされていません。関数呼び出しは同期のみです。ツール レスポンスを送信するまで、モデルはレスポンスを開始しません。非同期関数呼び出しをご覧ください。
- プロアクティブ音声と感情的な対話: これらの機能は、Gemini 3.1 Flash Live ではまだ サポートされていません。これらの機能の構成をコードから削除してください。 プロアクティブ音声と 感情的な対話をご覧ください。
機能の詳細な比較については、 モデル比較表を 機能ガイドでご覧ください。