Gemini 3.1 Flash ライブ プレビュー

Gemini 3.1 Flash Live Preview は、リアルタイムの会話と音声優先の AI アプリケーション向けに最適化された低レイテンシの音声対音声モデルです。音響のニュアンスの検出、数値の精度、マルチモーダル認識を備えています。

ドキュメント

機能と機能の詳細については、Live API ガイドをご覧ください。

gemini-3.1-flash-live-preview

プロパティ 説明
モデルコード gemini-3.1-flash-live-preview
でサポートされるデータ型

入力

テキスト、画像、音声、動画

出力

テキストと音声

トークン上限[*]

入力トークンの上限

131,072

出力トークンの上限

65,536

機能

音声生成

サポート対象

Batch API

サポート対象外

キャッシュ保存

サポート対象外

コードの実行

サポート対象外

ファイル検索

サポート対象外

関数呼び出し

サポート対象

Google マップによるグラウンディング

サポート対象外

画像生成

サポート対象外

Live API

サポート対象

検索によるグラウンディング

サポート対象

構造化出力

サポート対象外

思考モード

サポート対象

URL コンテキスト

サポート対象外

バージョン
詳細については、モデル バージョンのパターンをご覧ください。
  • プレビュー: gemini-3.1-flash-live-preview
最終更新日 2026 年 3 月
ナレッジ カットオフ 2025 年 1 月

Gemini 2.5 Flash Live からの移行

Gemini 3.1 Flash Live プレビュー版は、低レイテンシのリアルタイムの会話に最適化されています。gemini-2.5-flash-native-audio-preview-12-2025 から移行する場合は、次の点を考慮してください。

  • モデル文字列: モデル文字列を gemini-2.5-flash-native-audio-preview-12-2025 から gemini-3.1-flash-live-preview に更新します。
  • 思考モードの構成: Gemini 3.1 は thinkingBudget ではなく thinkingLevelminimallowmediumhigh などの設定を含む)を使用します。デフォルトは minimal で、レイテンシを最小限に抑えるように最適化されます。思考レベルと予算をご覧ください。
  • サーバー イベント: 1 つの BidiGenerateContentServerContent イベントに複数のコンテンツ部分(音声チャンクや文字起こしなど)を同時に含めることができるようになりました。コンテンツの欠落を防ぐため、各イベントのすべての部分を処理するようにコードを更新します。
  • クライアント コンテンツ: send_client_content は、初期コンテキスト履歴のシード処理でのみサポートされます(history_configinitial_history_in_client_content を設定する必要があります)。会話中にテキストの更新を送信するには、send_realtime_input を使用します。コンテンツの増分更新をご覧ください。
  • カバレッジをオンにする: デフォルトは TURN_INCLUDES_ONLY_ACTIVITY ではなく TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO です。モデルのターンには、検出された音声アクティビティとすべての動画フレームが含まれるようになりました。アプリケーションが現在、動画フレームの定常的なストリームを送信している場合は、追加費用が発生しないように、音声アクティビティがある場合にのみ動画フレームを送信するようにアプリケーションを更新することをおすすめします。
  • 非同期関数呼び出し: まだサポートされていません。関数呼び出しは同期のみです。ツール レスポンスを送信するまで、モデルはレスポンスを開始しません。非同期関数呼び出しをご覧ください。
  • プロアクティブな音声と感情的な対話: これらの機能は、Gemini 3.1 Flash Live ではまだサポートされていません。コードからこれらの機能の構成を削除します。プロアクティブ音声感情的な会話をご覧ください。

機能の詳細な比較については、機能ガイドのモデル比較表をご覧ください。