Pratinjau Langsung Gemini 3.1 Flash

Pratinjau Langsung Gemini 3.1 Flash adalah model audio-ke-audio latensi rendah kami yang dioptimalkan untuk dialog real-time dan aplikasi AI berbasis suara dengan deteksi nuansa akustik, presisi numerik, dan kesadaran multimodal.

Dokumentasi

Buka panduan Live API untuk mengetahui cakupan lengkap fitur dan kemampuan.

gemini-3.1-flash-live-preview

Properti Deskripsi
Kode model gemini-3.1-flash-live-preview
Jenis data yang didukung

Input

Teks, gambar, audio, video

Output

Teks dan audio

Batas token[*]

Batas token input

131.072

Batas token output

65.536

Kemampuan

Pembuatan audio

Didukung

Batch API

Tidak didukung

Menyimpan ke cache

Tidak didukung

Eksekusi kode

Tidak didukung

Penelusuran file

Tidak Didukung

Panggilan fungsi

Didukung

Melakukan grounding dengan Google Maps

Tidak didukung

Pembuatan gambar

Tidak didukung

Live API

Didukung

Grounding penelusuran

Didukung

Output terstruktur

Tidak didukung

Berpikir

Didukung

Konteks URL

Tidak didukung

Versi
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Pratinjau: gemini-3.1-flash-live-preview
Pembaruan terbaru Maret 2026
Batas informasi Januari 2025

Bermigrasi dari Gemini 2.5 Flash Live

Pratinjau Langsung Gemini 3.1 Flash dioptimalkan untuk dialog real-time dengan latensi rendah. Saat bermigrasi dari gemini-2.5-flash-native-audio-preview-12-2025, pertimbangkan hal berikut:

  • String model: Perbarui string model Anda dari gemini-2.5-flash-native-audio-preview-12-2025 menjadi gemini-3.1-flash-live-preview.
  • Konfigurasi pemikiran: Gemini 3.1 menggunakan thinkingLevel (dengan setelan seperti minimal, low, medium, dan high) dan bukan thinkingBudget. Nilai defaultnya adalah minimal untuk mengoptimalkan latensi terendah. Lihat Tingkat dan anggaran yang perlu dipertimbangkan.
  • Peristiwa server: Satu peristiwa BidiGenerateContentServerContent kini dapat berisi beberapa bagian konten secara bersamaan (misalnya, potongan audio dan transkrip). Perbarui kode Anda untuk memproses semua bagian dalam setiap peristiwa untuk menghindari konten yang hilang.
  • Konten klien: send_client_content hanya didukung untuk mengisi histori konteks awal (memerlukan setelan initial_history_in_client_content di history_config). Gunakan send_realtime_input untuk mengirim pembaruan teks selama percakapan. Lihat Update konten inkremental.
  • Cakupan belokan: Secara default TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO, bukan TURN_INCLUDES_ONLY_ACTIVITY. Giliran model kini mencakup aktivitas audio yang terdeteksi dan semua frame video. Jika aplikasi Anda saat ini mengirimkan aliran frame video yang konstan, Anda mungkin ingin memperbarui aplikasi agar hanya mengirimkan frame video saat ada aktivitas audio untuk menghindari biaya tambahan.
  • Pemanggilan fungsi asinkron: Belum didukung. Panggilan fungsi hanya bersifat sinkron. Model tidak akan mulai merespons hingga Anda mengirimkan respons alat. Lihat Panggilan fungsi asinkron.
  • Audio proaktif dan dialog afektif: Fitur ini belum didukung di Gemini 3.1 Flash Live. Hapus konfigurasi apa pun untuk fitur ini dari kode Anda. Lihat Audio proaktif dan Dialog afektif.

Untuk perbandingan fitur mendetail, lihat tabel Perbandingan model dalam panduan kemampuan.