Gemini 3.1 Flash Live Preview は、リアルタイムの会話や音声ファーストの AI アプリケーション向けに最適化された低レイテンシの音声対音声モデルです。音響のニュアンス検出、数値の精度、マルチモーダル認識を備えています。
ドキュメント
機能と機能の詳細については、Live API ガイドをご覧ください。
gemini-3.1-flash-live-preview
| プロパティ | 説明 |
|---|---|
| モデルコード |
gemini-3.1-flash-live-preview
|
| でサポートされるデータ型 |
入力 テキスト、画像、音声、動画 出力 テキストと音声 |
| トークンの上限[*] |
入力トークンの上限 131,072 出力トークンの上限 65,536 |
| 機能 |
サポート対象 サポート対象外 サポート対象外 サポート対象外 サポート対象 サポート対象外 サポート対象外 サポート対象 サポート対象 サポート対象外 サポート対象 サポート対象外 |
| 使用オプション |
サポート対象外 |
| バージョン |
|
| 最終更新日 | 2026 年 3 月 |
| ナレッジ カットオフ | 2025 年 1 月 |
Gemini 2.5 Flash Live から移行する
Gemini 3.1 Flash Live Preview は、低レイテンシのリアルタイムの会話向けに最適化されています。gemini-2.5-flash-native-audio-preview-12-2025 から移行する場合は、次の点を考慮してください。
- モデル文字列: モデル文字列を
gemini-2.5-flash-native-audio-preview-12-2025からgemini-3.1-flash-live-previewに更新します。 - 思考構成: Gemini 3.1 は、
thinkingBudgetではなくthinkingLevel(minimal、low、medium、highなどの設定を含む)を使用します。デフォルトはminimalで、レイテンシを最小限に抑えるように最適化されます。思考レベルと予算をご覧ください。 - サーバー イベント: 1 つの
BidiGenerateContentServerContentイベントに複数のコンテンツ部分(音声チャンクや文字起こしなど)を同時に含めることができるようになりました。コンテンツの欠落を防ぐため、各イベントのすべての部分を処理するようにコードを更新します。 - クライアント コンテンツ:
send_client_contentは、初期コンテキスト履歴のシード処理でのみサポートされます(history_configでinitial_history_in_client_contentを設定する必要があります)。会話中にテキストの更新を送信するには、send_realtime_inputを使用します。コンテンツの増分更新をご覧ください。 - カバレッジをオンにする: デフォルトは
TURN_INCLUDES_ONLY_ACTIVITYではなくTURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOです。モデルのターンには、検出された音声アクティビティとすべての動画フレームが含まれるようになりました。アプリケーションが現在、動画フレームの定常的なストリームを送信している場合は、追加費用が発生しないように、音声アクティビティがある場合にのみ動画フレームを送信するようにアプリケーションを更新することをおすすめします。 - 非同期関数呼び出し: まだサポートされていません。関数呼び出しは同期のみです。ツール レスポンスを送信するまで、モデルは応答を開始しません。非同期関数呼び出しをご覧ください。
- プロアクティブな音声と感情的な会話: これらの機能は、Gemini 3.1 Flash Live ではまだサポートされていません。コードからこれらの機能の構成を削除します。プロアクティブ音声と感情的な会話をご覧ください。
機能の詳細な比較については、機能ガイドのモデル比較表をご覧ください。