Interactions API 現已正式發布。建議使用這個 API，存取所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3.1 Flash Live Preview

Gemini 3.1 Flash Live 預先發布版是低延遲的語音轉語音模型，經過最佳化調整，可即時對話、偵測聲學細微差異、提供數值精確度，以及感知多模態資訊，非常適合語音優先的 AI 應用程式。

說明文件

如要全面瞭解功能，請參閱 Live API 指南。

gemini-3.1-flash-live-preview

屬性	說明
模型代碼	`gemini-3.1-flash-live-preview`
支援的資料類型	輸入裝置文字、圖片、音訊、影片輸出內容文字和音訊
代幣限制^[*]	輸入權杖限制 131,072 輸出詞元限制 65,536
功能	生成音訊支援快取不支援執行程式碼不支援檔案搜尋不支援函式呼叫支援利用 Google 地圖建立基準不支援圖像生成不支援 Live API 支援以搜尋為基準支援結構化輸出內容不支援思考支援網址內容不支援
計費方案	批次 API 不支援
個版本	如要瞭解詳情，請參閱模型版本模式。預覽：`gemini-3.1-flash-live-preview`
最新更新	2026 年 3 月
知識截點	2025 年 1 月

從 Gemini 2.5 Flash Live 遷移

Gemini 3.1 Flash Live 預先發布版經過最佳化處理，可提供低延遲的即時對話體驗。從 gemini-2.5-flash-native-audio-preview-12-2025 遷移時，請注意下列事項：

模型字串：將模型字串從 gemini-2.5-flash-native-audio-preview-12-2025 更新為 gemini-3.1-flash-live-preview。
思考設定：Gemini 3.1 使用 thinkingLevel (搭配 minimal、low、medium 和 high 等設定)，而非 thinkingBudget。預設值為 minimal，可將延遲時間降至最低。請參閱思考層級和預算。
伺服器事件：單一 BidiGenerateContentServerContent 事件現在可以同時包含多個內容部分 (例如音訊區塊和轉錄稿)。更新程式碼，處理每個事件中的所有部分，以免遺漏內容。
用戶端內容：send_client_content 僅支援用於植入初始內容記錄 (需要設定 initial_history_in_client_content 於 history_config)。在對話期間，請使用 send_realtime_input 傳送文字更新。請參閱「內容增量更新」。
開啟涵蓋範圍：預設為 TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO，而非 TURN_INCLUDES_ONLY_ACTIVITY。現在模型的回覆會納入偵測到的音訊活動和所有影片影格。如果應用程式目前會持續傳送影片影格串流，建議您更新應用程式，只在有音訊活動時傳送影片影格，避免產生額外費用。
非同步函式呼叫：尚未支援。函式呼叫僅支援同步。您必須先傳送工具回覆，模型才會開始回覆。請參閱非同步函式呼叫。
主動式音訊和情感對話：Gemini 3.1 Flash Live 目前不支援這些功能。請從程式碼中移除這些功能的任何設定。請參閱「主動式音訊」和「情緒感知對話」。

如需詳細的功能比較，請參閱功能指南中的「模式比較」表格。