Gemini 3.1 Flash ライブ プレビュー

Gemini 3.1 Flash Live Preview は、低レイテンシの音声対音声モデルです。音響ニュアンス検出、数値精度、マルチモーダル認識を備え、リアルタイムの対話や音声優先の AI アプリケーション向けに最適化されています。

ドキュメント

機能と性能の詳細については、Live API ガイドをご覧ください。

gemini-3.1-flash-live-preview

プロパティ 説明
モデルコード gemini-3.1-flash-live-preview
サポートされているデータ型

入力

テキスト、画像、音声、動画

出力

テキストと音声

トークン上限[*]

入力トークンの上限

131,072

出力トークンの上限

65,536

機能

音声生成

サポート対象

Batch API

サポート対象外

キャッシュ保存

サポート対象外

コードの実行

サポート対象外

ファイル検索

サポート対象外

関数呼び出し

サポート対象

Google マップによるグラウンディング

サポート対象外

画像生成

サポート対象外

Live API

サポート対象

検索によるグラウンディング

サポート対象

構造化出力

サポート対象外

思考モード

サポート対象

URL コンテキスト

サポート対象外

バージョン
詳しくは、モデル バージョンのパターンをご覧ください。
  • プレビュー: gemini-3.1-flash-live-preview
最終更新日 2026 年 3 月
ナレッジ カットオフ 2025 年 1 月

Gemini 2.5 Flash Live からの移行

Gemini 3.1 Flash Live Preview は、低レイテンシのリアルタイム対話向けに最適化されています。 gemini-2.5-flash-native-audio-preview-12-2025 から移行する場合は、次の点を考慮してください。

  • モデル文字列: モデル文字列を gemini-2.5-flash-native-audio-preview-12-2025 から gemini-3.1-flash-live-preview に更新します。
  • 思考構成: Gemini 3.1 では、thinkingBudget ではなく thinkingLevelminimallowmediumhigh などの設定)を使用します。デフォルトは minimal で、レイテンシを最小限に抑えるように最適化されています。思考レベルと予算をご覧ください。
  • サーバー イベント: 1 つの BidiGenerateContentServerContent イベントに、複数のコンテンツ部分(たとえば、 音声チャンクや文字起こし)を同時に含めることができるようになりました。コンテンツが欠落しないように、各イベントのすべての部分を処理するようにコードを更新してください。
  • クライアント コンテンツ: send_client_content は、初期コンテキスト履歴のシード処理でのみサポートされています( initial_history_in_client_contenthistory_config を設定する必要があります)。会話中に テキストの更新を送信するには、 send_realtime_input を使用します。コンテンツの増分更新をご覧ください。
  • ターン カバレッジ: デフォルトは TURN_INCLUDES_ONLY_ACTIVITY ではなく TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO になりました。モデルのターンには、検出された音声アクティビティとすべての動画フレームが含まれるようになりました。アプリケーションが現在、動画フレームの定常的なストリームを送信している場合は、追加費用が発生しないように、音声アクティビティがある場合にのみ動画フレームを送信するようにアプリケーションを更新することをおすすめします。
  • 非同期関数呼び出し: まだサポートされていません。関数呼び出しは同期のみです。ツール レスポンスを送信するまで、モデルはレスポンスを開始しません。非同期関数呼び出しをご覧ください。
  • プロアクティブ音声と感情的な対話: これらの機能は、Gemini 3.1 Flash Live ではまだ サポートされていません。これらの機能の構成をコードから削除してください。 プロアクティブ音声感情的な対話をご覧ください。

機能の詳細な比較については、 モデル比較表を 機能ガイドでご覧ください。