Gemini 3.1 Flash Live Preview は、リアルタイムの会話と音声優先の AI アプリケーション向けに最適化された低レイテンシの音声対音声モデルです。音響のニュアンスの検出、数値の精度、マルチモーダル認識を備えています。
ドキュメント
機能と機能の詳細については、Live API ガイドをご覧ください。
gemini-3.1-flash-live-preview
| プロパティ | 説明 |
|---|---|
| モデルコード |
gemini-3.1-flash-live-preview
|
| でサポートされるデータ型 |
入力 テキスト、画像、音声、動画 出力 テキストと音声 |
| トークン上限[*] |
入力トークンの上限 131,072 出力トークンの上限 65,536 |
| 機能 |
音声生成 サポート対象 Batch API サポート対象外 キャッシュ保存 サポート対象外 コードの実行 サポート対象外 ファイル検索 サポート対象外 関数呼び出し サポート対象 Google マップによるグラウンディング サポート対象外 画像生成 サポート対象外 Live API サポート対象 検索によるグラウンディング サポート対象 構造化出力 サポート対象外 思考モード サポート対象 URL コンテキスト サポート対象外 |
| バージョン |
|
| 最終更新日 | 2026 年 3 月 |
| ナレッジ カットオフ | 2025 年 1 月 |
Gemini 2.5 Flash Live からの移行
Gemini 3.1 Flash Live プレビュー版は、低レイテンシのリアルタイムの会話に最適化されています。gemini-2.5-flash-native-audio-preview-12-2025 から移行する場合は、次の点を考慮してください。
- モデル文字列: モデル文字列を
gemini-2.5-flash-native-audio-preview-12-2025からgemini-3.1-flash-live-previewに更新します。 - 思考モードの構成: Gemini 3.1 は
thinkingBudgetではなくthinkingLevel(minimal、low、medium、highなどの設定を含む)を使用します。デフォルトはminimalで、レイテンシを最小限に抑えるように最適化されます。思考レベルと予算をご覧ください。 - サーバー イベント: 1 つの
BidiGenerateContentServerContentイベントに複数のコンテンツ部分(音声チャンクや文字起こしなど)を同時に含めることができるようになりました。コンテンツの欠落を防ぐため、各イベントのすべての部分を処理するようにコードを更新します。 - クライアント コンテンツ:
send_client_contentは、初期コンテキスト履歴のシード処理でのみサポートされます(history_configでinitial_history_in_client_contentを設定する必要があります)。会話中にテキストの更新を送信するには、send_realtime_inputを使用します。コンテンツの増分更新をご覧ください。 - カバレッジをオンにする: デフォルトは
TURN_INCLUDES_ONLY_ACTIVITYではなくTURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOです。モデルのターンには、検出された音声アクティビティとすべての動画フレームが含まれるようになりました。アプリケーションが現在、動画フレームの定常的なストリームを送信している場合は、追加費用が発生しないように、音声アクティビティがある場合にのみ動画フレームを送信するようにアプリケーションを更新することをおすすめします。 - 非同期関数呼び出し: まだサポートされていません。関数呼び出しは同期のみです。ツール レスポンスを送信するまで、モデルはレスポンスを開始しません。非同期関数呼び出しをご覧ください。
- プロアクティブな音声と感情的な対話: これらの機能は、Gemini 3.1 Flash Live ではまだサポートされていません。コードからこれらの機能の構成を削除します。プロアクティブ音声と感情的な会話をご覧ください。
機能の詳細な比較については、機能ガイドのモデル比較表をご覧ください。