Batas kapasitas mengatur jumlah permintaan yang dapat Anda buat ke Gemini API dalam jangka waktu tertentu. Batas ini membantu menjaga penggunaan yang wajar, melindungi dari penyalahgunaan, dan membantu menjaga performa sistem untuk semua pengguna.
Melihat batas kapasitas aktif di AI Studio
Cara kerja batas kapasitas
Batas kapasitas biasanya diukur dalam tiga dimensi:
- Permintaan per menit (RPM)
- Token per menit (input) (TPM)
- Permintaan per hari (RPD)
Penggunaan Anda dievaluasi terhadap setiap batas, dan melebihi salah satunya akan memicu error batas kapasitas. Misalnya, jika batas RPM Anda adalah 20, membuat 21 permintaan dalam satu menit akan menghasilkan error, meskipun Anda belum melebihi TPM atau batas lainnya.
Batas kapasitas diterapkan per project, bukan per kunci API. Kuota permintaan per hari (RPD) direset pada tengah malam Waktu Pasifik.
Batas bervariasi bergantung pada model tertentu yang digunakan, dan beberapa batas hanya berlaku untuk model tertentu. Misalnya, Gambar per menit, atau IPM, hanya dihitung untuk model yang dapat membuat gambar (Nano Banana), tetapi secara konseptual mirip dengan TPM. Model lain mungkin memiliki batas token per hari (TPD).
Batas kapasitas lebih dibatasi untuk model eksperimental dan pratinjau.
Tingkat penggunaan
Batas kapasitas terikat dengan tingkat penggunaan project. Saat penggunaan dan pengeluaran API Anda meningkat, Anda akan otomatis diupgrade ke tingkat yang lebih tinggi dengan batas kapasitas yang ditingkatkan.
Kualifikasi untuk Tingkat 2 dan 3 didasarkan pada total pengeluaran kumulatif untuk layanan Google Cloud (termasuk, tetapi tidak terbatas pada, Gemini API) untuk akun penagihan yang ditautkan ke project Anda.
| Tingkat penggunaan | Kualifikasi | Batas tingkat penagihan |
|---|---|---|
| Gratis | Project aktif atau uji coba gratis | T/A |
| Tingkat 1 | Menyiapkan dan menautkan akun penagihan aktif | $250 |
| Tingkat 2 | Membayar $100 + 3 hari sejak pembayaran pertama berhasil | $2.000 |
| Tingkat 3 | Membayar $1.000 + 30 hari sejak pembayaran pertama berhasil | $20.000 - $100.000+ |
Meskipun memenuhi kriteria kualifikasi yang dinyatakan umumnya cukup untuk mendapatkan persetujuan, dalam kasus yang jarang terjadi, permintaan upgrade dapat ditolak berdasarkan faktor lain yang diidentifikasi selama proses peninjauan.
Sistem ini membantu menjaga keamanan dan integritas platform Gemini API untuk semua pengguna.
Batas kapasitas Gemini API
Batas kapasitas bergantung pada berbagai faktor (seperti tingkat penggunaan Anda) dan dapat dilihat di Google AI Studio. Seiring waktu, batas kapasitas Anda akan otomatis diperbarui saat tingkat dan status akun Anda berubah.
Melihat batas kapasitas aktif di AI Studio
Batas kapasitas yang ditentukan tidak dijamin dan kapasitas sebenarnya dapat bervariasi.
Batas kapasitas inferensi prioritas
Konsumsiprioritas memiliki batas kapasitasnya sendiri meskipun konsumsi dihitung terhadap batas kapasitas traffic interaktif keseluruhan. Batas kapasitas default adalah: 0,3x batas kapasitas standar untuk setiap model dan tingkat
Batas kapasitas Batch API
Permintaan Batch API tunduk pada batas kapasitasnya sendiri, terpisah dari panggilan API non-batch.
- Permintaan batch serentak: 100
- Batas ukuran file input: 2 GB
- Batas penyimpanan file: 20 GB
- Token dalam antrean per model: Tabel Token dalam antrean batch mencantumkan jumlah maksimum token yang dapat diantrekan untuk pemrosesan batch di semua tugas batch aktif Anda untuk model tertentu.
Tingkat 1
| Model | Token dalam antrean batch | |||
|---|---|---|---|---|
| Model teks keluar | ||||
| Pratinjau Gemini 3.1 Pro | 5.000.000 | |||
| Gemini 3.1 Flash-Lite | 10.000.000 | |||
| Pratinjau Gemini 3.1 Flash-Lite | 10.000.000 | |||
| Gemini 3.5 Flash | 3.000.000 | |||
| Gemini 3.5 Flash | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Pratinjau Gemini 2.5 Flash | 3.000.000 | |||
| Pratinjau Gambar Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Pratinjau Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Gambar Gemini 2.0 Flash | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Model pembuatan multimodal | ||||
| Pratinjau Gambar Gemini 3.1 Flash 🍌 | 1.000.000 | |||
| Pratinjau Gambar Gemini 3 Pro 🍌 | 2.000.000 | |||
| Model embedding | ||||
| Embedding Gemini | 500.000 | |||
Tingkat 2
| Model | Token dalam antrean batch | |||
|---|---|---|---|---|
| Model teks keluar | ||||
| Pratinjau Gemini 3.1 Pro | 500.000.000 | |||
| Gemini 3.1 Flash-Lite | 500.000.000 | |||
| Pratinjau Gemini 3.1 Flash-Lite | 500.000.000 | |||
| Gemini 3.5 Flash | 400.000.000 | |||
| Gemini 3.5 Flash | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Pratinjau Gemini 2.5 Flash | 400.000.000 | |||
| Pratinjau Gambar Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Pratinjau Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Gambar Gemini 2.0 Flash | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Model pembuatan multimodal | ||||
| Pratinjau Gambar Gemini 3.1 Flash 🍌 | 250.000.000 | |||
| Pratinjau Gambar Gemini 3 Pro 🍌 | 270.000.000 | |||
| Model embedding | ||||
| Embedding Gemini | 5.000.000 | |||
Tingkat 3
| Model | Token dalam antrean batch | |||
|---|---|---|---|---|
| Model teks keluar | ||||
| Pratinjau Gemini 3.1 Pro | 1.000.000.000 | |||
| Gemini 3.1 Flash-Lite | 1.000.000.000 | |||
| Pratinjau Gemini 3.1 Flash-Lite | 1.000.000.000 | |||
| Gemini 3.5 Flash | 1.000.000.000 | |||
| Gemini 3.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Pratinjau Gemini 2.5 Flash | 1.000.000.000 | |||
| Pratinjau Gambar Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Pratinjau Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Gambar Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Model pembuatan multimodal | ||||
| Pratinjau Gambar Gemini 3.1 Flash 🍌 | 750.000.000 | |||
| Pratinjau Gambar Gemini 3 Pro 🍌 | 1.000.000.000 | |||
| Model embedding | ||||
| Embedding Gemini | 10.000.000 | |||
Cara mengupgrade ke tingkat berikutnya
Untuk bertransisi dari tingkat Gratis ke tingkat berbayar, Anda harus terlebih dahulu menyiapkan penagihan di AI Studio.
Setelah project Anda memenuhi kriteria yang ditentukan, project tersebut akan otomatis diupgrade ke tingkat berikutnya. Upgrade tingkat dari Gratis ke Tingkat 1 biasanya akan langsung berlaku, dan upgrade tingkat berikutnya akan berlaku dalam waktu 10 menit. Buka halaman Project di AI Studio untuk memeriksa tingkat Anda.
Meminta kenaikan batas kapasitas
Setiap variasi model memiliki batas kapasitas terkait (permintaan per menit, RPM). Untuk mengetahui detail batas kapasitas tersebut, lihat halaman Batas Kapasitas AI Studio.
Meminta kenaikan batas kapasitas tingkat berbayar
Kami tidak memberikan jaminan tentang peningkatan batas kapasitas Anda, tetapi kami akan berupaya sebaik mungkin untuk meninjau permintaan Anda.