Interactions API kini tersedia secara umum. Sebaiknya gunakan API ini untuk mengakses semua fitur dan model terbaru.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Pratinjau Langsung Gemini 3.1 Flash

Gemini 3.1 Flash Live Preview adalah model audio-ke-audio latensi rendah kami yang dioptimalkan untuk dialog real-time dan aplikasi AI yang mengutamakan suara dengan deteksi nuansa akustik, presisi numerik, dan kesadaran multimodal.

Coba di Google AI Studio

Dokumentasi

Lihat panduan Live API untuk mengetahui cakupan lengkap fitur dan kemampuan.

gemini-3.1-flash-live-preview

Properti	Deskripsi
Kode model	`gemini-3.1-flash-live-preview`
Jenis data yang didukung	Input Teks, gambar, audio, video Output Teks dan audio
Batas token^[*]	Batas token input 131.072 Batas token output 65.536
Kemampuan	Pembuatan audio Didukung Caching Tidak didukung Eksekusi kode Tidak didukung Penelusuran file Tidak Didukung Panggilan fungsi Didukung Grounding with Google Maps Tidak didukung Pembuatan gambar Tidak didukung Live API Didukung Grounding penelusuran Didukung Output terstruktur Tidak didukung Penalaran Didukung Konteks URL Tidak didukung
Opsi konsumsi	Batch API Tidak didukung
Versi	Baca pola versi model untuk mengetahui detail selengkapnya. Pratinjau: `gemini-3.1-flash-live-preview`
Update terbaru	Maret 2026
Batas pengetahuan	Januari 2025

Bermigrasi dari Gemini 2.5 Flash Live

Gemini 3.1 Flash Live Preview dioptimalkan untuk dialog real-time latensi rendah. Saat bermigrasi dari gemini-2.5-flash-native-audio-preview-12-2025, pertimbangkan hal berikut:

String model: Perbarui string model dari gemini-2.5-flash-native-audio-preview-12-2025 ke gemini-3.1-flash-live-preview.
Konfigurasi penalaran: Gemini 3.1 menggunakan thinkingLevel (dengan setelan seperti minimal, low, medium, dan high) dan bukan thinkingBudget. Nilai defaultnya adalah minimal untuk mengoptimalkan latensi terendah. Lihat Tingkat dan anggaran penalaran.
Peristiwa server: Satu peristiwa BidiGenerateContentServerContent kini dapat berisi beberapa bagian konten secara bersamaan (misalnya, potongan audio dan transkrip). Perbarui kode Anda untuk memproses semua bagian di setiap peristiwa agar tidak ada konten yang terlewat.
Konten klien: send_client_content hanya didukung untuk menanam histori konteks awal (memerlukan setelan initial_history_in_client_content di history_config). Gunakan send_realtime_input untuk mengirim pembaruan teks selama percakapan. Lihat Pembaruan konten inkremental.
Cakupan giliran: Defaultnya adalah TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO, bukan TURN_INCLUDES_ONLY_ACTIVITY. Giliran model kini mencakup aktivitas audio yang terdeteksi dan semua frame video. Jika aplikasi Anda saat ini mengirimkan aliran frame video yang konstan, sebaiknya perbarui aplikasi Anda agar hanya mengirimkan frame video saat ada aktivitas audio untuk menghindari biaya tambahan.
Panggilan fungsi asinkron: Belum didukung. Panggilan fungsi hanya bersifat sinkron. Model tidak akan mulai merespons hingga Anda mengirim respons alat. Lihat Panggilan fungsi asinkron.
Dialog audio proaktif dan afektif: Fitur ini belum didukung di Gemini 3.1 Flash Live. Hapus konfigurasi untuk fitur ini dari kode Anda. Lihat Audio proaktif dan Dialog afektif.

Untuk perbandingan fitur mendetail, lihat tabel Perbandingan model di panduan kemampuan.