Pratinjau Langsung Gemini 3.1 Flash

Gemini 3.1 Flash Live Preview adalah model audio-ke-audio latensi rendah yang dioptimalkan untuk dialog real-time dan aplikasi AI yang mengutamakan suara dengan deteksi nuansa akustik, presisi numerik, dan kesadaran multimodal.

Dokumentasi

Lihat panduan Live API untuk mengetahui cakupan lengkap fitur dan kemampuan.

gemini-3.1-flash-live-preview

Properti Deskripsi
Kode model gemini-3.1-flash-live-preview
Jenis data yang didukung

Input

Teks, gambar, audio, video

Output

Teks dan audio

Batas token[*]

Batas token input

131.072

Batas token output

65.536

Kemampuan

Pembuatan audio

Didukung

Batch API

Tidak didukung

Menyimpan ke cache

Tidak didukung

Eksekusi kode

Tidak didukung

Penelusuran file

Tidak Didukung

Panggilan fungsi

Didukung

Grounding dengan Google Maps

Tidak didukung

Pembuatan gambar

Tidak didukung

Live API

Didukung

Grounding penelusuran

Didukung

Output terstruktur

Tidak didukung

Pemikiran

Didukung

Konteks URL

Tidak didukung

Versi
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Pratinjau: gemini-3.1-flash-live-preview
Update terbaru Maret 2026
Batas informasi Januari 2025

Bermigrasi dari Gemini 2.5 Flash Live

Gemini 3.1 Flash Live Preview dioptimalkan untuk dialog real-time latensi rendah. Saat bermigrasi dari gemini-2.5-flash-native-audio-preview-12-2025, pertimbangkan hal berikut:

  • String model: Perbarui string model dari gemini-2.5-flash-native-audio-preview-12-2025 ke gemini-3.1-flash-live-preview.
  • Konfigurasi pemikiran: Gemini 3.1 menggunakan thinkingLevel (dengan setelan seperti minimal, low, medium, dan high) dan bukan thinkingBudget. Setelan defaultnya adalah minimal untuk mengoptimalkan latensi terendah. Lihat Tingkat dan anggaran pemikiran.
  • Peristiwa server: Satu peristiwa BidiGenerateContentServerContent kini dapat berisi beberapa bagian konten secara bersamaan (misalnya, potongan audio dan transkrip). Perbarui kode Anda untuk memproses semua bagian dalam setiap peristiwa agar tidak ada konten yang terlewat.
  • Konten klien: send_client_content hanya didukung untuk menanam histori konteks awal (memerlukan setelan initial_history_in_client_content di history_config). Gunakan send_realtime_input untuk mengirim pembaruan teks selama percakapan. Lihat Pembaruan konten inkremental.
  • Cakupan giliran: Defaultnya adalah TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO, bukan TURN_INCLUDES_ONLY_ACTIVITY. Giliran model kini mencakup aktivitas audio yang terdeteksi dan semua frame video. Jika aplikasi Anda saat ini mengirimkan aliran frame video yang konstan, sebaiknya perbarui aplikasi Anda agar hanya mengirimkan frame video saat ada aktivitas audio untuk menghindari biaya tambahan.
  • Panggilan fungsi asinkron: Belum didukung. Panggilan fungsi hanya bersifat sinkron. Model tidak akan mulai merespons hingga Anda mengirim respons alat. Lihat Panggilan fungsi asinkron.
  • Dialog audio proaktif dan afektif: Fitur ini belum didukung di Gemini 3.1 Flash Live. Hapus konfigurasi apa pun untuk fitur ini dari kode Anda. Lihat Audio proaktif dan Dialog afektif.

Untuk perbandingan fitur mendetail, lihat tabel Perbandingan model dalam panduan kemampuan.