Batas kapasitas

Batas kapasitas mengatur jumlah permintaan yang dapat Anda buat ke Gemini API dalam jangka waktu tertentu. Batas ini membantu menjaga penggunaan yang wajar, melindungi dari penyalahgunaan, dan membantu menjaga performa sistem untuk semua pengguna.

Melihat batas kapasitas aktif di AI Studio

Cara kerja batas kapasitas

Batas kapasitas biasanya diukur dalam tiga dimensi:

  • Permintaan per menit (RPM)
  • Token per menit (input) (TPM)
  • Permintaan per hari (RPD)

Penggunaan Anda dievaluasi terhadap setiap batas, dan melebihi salah satunya akan memicu error batas kapasitas. Misalnya, jika batas RPM Anda adalah 20, membuat 21 permintaan dalam satu menit akan menghasilkan error, meskipun Anda belum melebihi TPM atau batas lainnya.

Batas kapasitas diterapkan per project, bukan per kunci API. Kuota permintaan per hari (RPD) direset pada tengah malam Waktu Pasifik.

Batas bervariasi bergantung pada model tertentu yang digunakan, dan beberapa batas hanya berlaku untuk model tertentu. Misalnya, Gambar per menit, atau IPM, hanya dihitung untuk model yang dapat membuat gambar (Nano Banana), tetapi secara konseptual mirip dengan TPM. Model lain mungkin memiliki batas token per hari (TPD).

Batas kapasitas lebih dibatasi untuk model eksperimental dan pratinjau.

Tingkat penggunaan

Batas kapasitas terikat dengan tingkat penggunaan project. Saat penggunaan dan pengeluaran API Anda meningkat, Anda akan otomatis diupgrade ke tingkat yang lebih tinggi dengan batas kapasitas yang ditingkatkan.

Kualifikasi untuk Tingkat 2 dan 3 didasarkan pada total pengeluaran kumulatif untuk layanan Google Cloud (termasuk, tetapi tidak terbatas pada, Gemini API) untuk akun penagihan yang ditautkan ke project Anda.

Tingkat penggunaan Kualifikasi Batas tingkat penagihan
Gratis Project aktif atau uji coba gratis T/A
Tingkat 1 Menyiapkan dan menautkan akun penagihan aktif $250
Tingkat 2 Membayar $100 + 3 hari sejak pembayaran pertama berhasil $2.000
Tingkat 3 Membayar $1.000 + 30 hari sejak pembayaran pertama berhasil $20.000 - $100.000+

Meskipun memenuhi kriteria kualifikasi yang dinyatakan umumnya cukup untuk mendapatkan persetujuan, dalam kasus yang jarang terjadi, permintaan upgrade dapat ditolak berdasarkan faktor lain yang diidentifikasi selama proses peninjauan.

Sistem ini membantu menjaga keamanan dan integritas platform Gemini API untuk semua pengguna.

Batas kapasitas Gemini API

Batas kapasitas bergantung pada berbagai faktor (seperti tingkat penggunaan Anda) dan dapat dilihat di Google AI Studio. Seiring waktu, batas kapasitas Anda akan otomatis diperbarui saat tingkat dan status akun Anda berubah.

Melihat batas kapasitas aktif di AI Studio

Batas kapasitas yang ditentukan tidak dijamin dan kapasitas sebenarnya dapat bervariasi.

Batas kapasitas inferensi prioritas

Konsumsiprioritas memiliki batas kapasitasnya sendiri meskipun konsumsi dihitung terhadap batas kapasitas traffic interaktif keseluruhan. Batas kapasitas default adalah: 0,3x batas kapasitas standar untuk setiap model dan tingkat

Batas kapasitas Batch API

Permintaan Batch API tunduk pada batas kapasitasnya sendiri, terpisah dari panggilan API non-batch.

  • Permintaan batch serentak: 100
  • Batas ukuran file input: 2 GB
  • Batas penyimpanan file: 20 GB
  • Token dalam antrean per model: Tabel Token dalam antrean batch mencantumkan jumlah maksimum token yang dapat diantrekan untuk pemrosesan batch di semua tugas batch aktif Anda untuk model tertentu.

Tingkat 1

Model Token dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro 5.000.000
Gemini 3.1 Flash-Lite 10.000.000
Pratinjau Gemini 3.1 Flash-Lite 10.000.000
Gemini 3.5 Flash 3.000.000
Gemini 3.5 Flash 3.000.000
Gemini 2.5 Pro 5.000.000
Gemini 2.5 Pro TTS 25.000
Gemini 2.5 Flash 3.000.000
Pratinjau Gemini 2.5 Flash 3.000.000
Pratinjau Gambar Gemini 2.5 Flash 3.000.000
Gemini 2.5 Flash TTS 100.000
Gemini 2.5 Flash-Lite 10.000.000
Pratinjau Gemini 2.5 Flash-Lite 10.000.000
Gemini 2.0 Flash 10.000.000
Gambar Gemini 2.0 Flash 3.000.000
Gemini 2.0 Flash-Lite 10.000.000
Model pembuatan multimodal
Pratinjau Gambar Gemini 3.1 Flash 🍌 1.000.000
Pratinjau Gambar Gemini 3 Pro 🍌 2.000.000
Model embedding
Embedding Gemini 500.000

Tingkat 2

Model Token dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro 500.000.000
Gemini 3.1 Flash-Lite 500.000.000
Pratinjau Gemini 3.1 Flash-Lite 500.000.000
Gemini 3.5 Flash 400.000.000
Gemini 3.5 Flash 400.000.000
Gemini 2.5 Pro 500.000.000
Gemini 2.5 Pro TTS 100.000
Gemini 2.5 Flash 400.000.000
Pratinjau Gemini 2.5 Flash 400.000.000
Pratinjau Gambar Gemini 2.5 Flash 400.000.000
Gemini 2.5 Flash TTS 100.000
Gemini 2.5 Flash-Lite 500.000.000
Pratinjau Gemini 2.5 Flash-Lite 500.000.000
Gemini 2.0 Flash 1.000.000.000
Gambar Gemini 2.0 Flash 400.000.000
Gemini 2.0 Flash-Lite 1.000.000.000
Model pembuatan multimodal
Pratinjau Gambar Gemini 3.1 Flash 🍌 250.000.000
Pratinjau Gambar Gemini 3 Pro 🍌 270.000.000
Model embedding
Embedding Gemini 5.000.000

Tingkat 3

Model Token dalam antrean batch
Model teks keluar
Pratinjau Gemini 3.1 Pro 1.000.000.000
Gemini 3.1 Flash-Lite 1.000.000.000
Pratinjau Gemini 3.1 Flash-Lite 1.000.000.000
Gemini 3.5 Flash 1.000.000.000
Gemini 3.5 Flash 1.000.000.000
Gemini 2.5 Pro 1.000.000.000
Gemini 2.5 Pro TTS 1.000.000
Gemini 2.5 Flash 1.000.000.000
Pratinjau Gemini 2.5 Flash 1.000.000.000
Pratinjau Gambar Gemini 2.5 Flash 1.000.000.000
Gemini 2.5 Flash TTS 4.000.000
Gemini 2.5 Flash-Lite 1.000.000.000
Pratinjau Gemini 2.5 Flash-Lite 1.000.000.000
Gemini 2.0 Flash 5.000.000.000
Gambar Gemini 2.0 Flash 1.000.000.000
Gemini 2.0 Flash-Lite 5.000.000.000
Model pembuatan multimodal
Pratinjau Gambar Gemini 3.1 Flash 🍌 750.000.000
Pratinjau Gambar Gemini 3 Pro 🍌 1.000.000.000
Model embedding
Embedding Gemini 10.000.000

Cara mengupgrade ke tingkat berikutnya

Untuk bertransisi dari tingkat Gratis ke tingkat berbayar, Anda harus terlebih dahulu menyiapkan penagihan di AI Studio.

Setelah project Anda memenuhi kriteria yang ditentukan, project tersebut akan otomatis diupgrade ke tingkat berikutnya. Upgrade tingkat dari Gratis ke Tingkat 1 biasanya akan langsung berlaku, dan upgrade tingkat berikutnya akan berlaku dalam waktu 10 menit. Buka halaman Project di AI Studio untuk memeriksa tingkat Anda.

Meminta kenaikan batas kapasitas

Setiap variasi model memiliki batas kapasitas terkait (permintaan per menit, RPM). Untuk mengetahui detail batas kapasitas tersebut, lihat halaman Batas Kapasitas AI Studio.

Meminta kenaikan batas kapasitas tingkat berbayar

Kami tidak memberikan jaminan tentang peningkatan batas kapasitas Anda, tetapi kami akan berupaya sebaik mungkin untuk meninjau permintaan Anda.