Pratinjau Langsung Gemini 3.1 Flash adalah model audio-ke-audio latensi rendah kami yang dioptimalkan untuk dialog real-time dan aplikasi AI berbasis suara dengan deteksi nuansa akustik, presisi numerik, dan kesadaran multimodal.
Dokumentasi
Buka panduan Live API untuk mengetahui cakupan lengkap fitur dan kemampuan.
gemini-3.1-flash-live-preview
| Properti | Deskripsi |
|---|---|
| Kode model |
gemini-3.1-flash-live-preview
|
| Jenis data yang didukung |
Input Teks, gambar, audio, video Output Teks dan audio |
| Batas token[*] |
Batas token input 131.072 Batas token output 65.536 |
| Kemampuan |
Pembuatan audio Didukung Batch API Tidak didukung Menyimpan ke cache Tidak didukung Eksekusi kode Tidak didukung Penelusuran file Tidak Didukung Panggilan fungsi Didukung Melakukan grounding dengan Google Maps Tidak didukung Pembuatan gambar Tidak didukung Live API Didukung Grounding penelusuran Didukung Output terstruktur Tidak didukung Berpikir Didukung Konteks URL Tidak didukung |
| Versi |
|
| Pembaruan terbaru | Maret 2026 |
| Batas informasi | Januari 2025 |
Bermigrasi dari Gemini 2.5 Flash Live
Pratinjau Langsung Gemini 3.1 Flash dioptimalkan untuk dialog real-time dengan latensi rendah.
Saat bermigrasi dari gemini-2.5-flash-native-audio-preview-12-2025, pertimbangkan hal berikut:
- String model: Perbarui string model Anda dari
gemini-2.5-flash-native-audio-preview-12-2025menjadigemini-3.1-flash-live-preview. - Konfigurasi pemikiran: Gemini 3.1 menggunakan
thinkingLevel(dengan setelan sepertiminimal,low,medium, danhigh) dan bukanthinkingBudget. Nilai defaultnya adalahminimaluntuk mengoptimalkan latensi terendah. Lihat Tingkat dan anggaran yang perlu dipertimbangkan. - Peristiwa server: Satu peristiwa
BidiGenerateContentServerContentkini dapat berisi beberapa bagian konten secara bersamaan (misalnya, potongan audio dan transkrip). Perbarui kode Anda untuk memproses semua bagian dalam setiap peristiwa untuk menghindari konten yang hilang. - Konten klien:
send_client_contenthanya didukung untuk mengisi histori konteks awal (memerlukan setelaninitial_history_in_client_contentdihistory_config). Gunakansend_realtime_inputuntuk mengirim pembaruan teks selama percakapan. Lihat Update konten inkremental. - Cakupan belokan: Secara default
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO, bukanTURN_INCLUDES_ONLY_ACTIVITY. Giliran model kini mencakup aktivitas audio yang terdeteksi dan semua frame video. Jika aplikasi Anda saat ini mengirimkan aliran frame video yang konstan, Anda mungkin ingin memperbarui aplikasi agar hanya mengirimkan frame video saat ada aktivitas audio untuk menghindari biaya tambahan. - Pemanggilan fungsi asinkron: Belum didukung. Panggilan fungsi hanya bersifat sinkron. Model tidak akan mulai merespons hingga Anda mengirimkan respons alat. Lihat Panggilan fungsi asinkron.
- Audio proaktif dan dialog afektif: Fitur ini belum didukung di Gemini 3.1 Flash Live. Hapus konfigurasi apa pun untuk fitur ini dari kode Anda. Lihat Audio proaktif dan Dialog afektif.
Untuk perbandingan fitur mendetail, lihat tabel Perbandingan model dalam panduan kemampuan.