Penagihan

Panduan ini berisi ringkasan berbagai opsi penagihan Gemini API, menjelaskan cara mengaktifkan penagihan dan memantau penggunaan, serta memberikan jawaban atas pertanyaan umum (FAQ) tentang penagihan.

Tentang penagihan

Penagihan untuk Gemini API didasarkan pada dua tingkat harga: tanpa biaya (atau gratis) dan bayar sesuai penggunaan (atau berbayar). Harga dan batas tarif berbeda di antara tingkat ini dan juga bervariasi berdasarkan model. Untuk harga saat ini dan batas tarif, lihat Harga. Untuk perincian kemampuan model demi model, lihat Halaman model Gemini.

Batas kapasitas

Batas kapasitas adalah kuota yang membatasi jumlah permintaan atau token yang dapat Anda kirim ke Gemini API periode waktu tertentu. Batas kapasitas dapat berlaku per permintaan atau per token. Berikut adalah contoh fiktif kuota yang mungkin berlaku untuk model tertentu dalam tingkat tertentu:

  • 10 RPM (permintaan per menit)
  • 10.000 TPM (token per menit)
  • 1.000 RPD (permintaan per hari)

Dalam contoh ini, jika Anda melebihi 10 RPM (atau 10.000 TPM atau 1.000 RPD), Layanan Gemini API menampilkan error 429: RESOURCE_EXHAUSTED yang menunjukkan Anda telah melampaui batas nilai.

Jika Anda mengaktifkan penagihan dan menggunakan paket berbayar, Anda akan mendapatkan manfaat dari tarif yang lebih tinggi batas, dan perintah serta respons Anda tidak akan digunakan untuk meningkatkan kualitas produk Google. Untuk informasi selengkapnya tentang penggunaan data untuk layanan berbayar, lihat persyaratan layanan.

Penagihan Cloud

Gemini API menggunakan Penagihan Cloud untuk layanan penagihan. Untuk menggunakan paket berbayar, Anda harus menyiapkan Penagihan Cloud di project cloud Anda. Setelah mengaktifkan Penagihan Cloud, Anda dapat menggunakan Alat penagihan untuk memantau pengeluaran, memahami biaya, melakukan pembayaran, dan mengakses dukungan Penagihan Cloud.

Aktifkan penagihan

Anda dapat mengaktifkan Penagihan Cloud mulai dari Google AI Studio:

  1. Buka Google AI Studio.

  2. Di bagian bawah sidebar kiri, pilih Setelan > Informasi paket.

  3. Klik Set up Billing pada project yang dipilih untuk mengaktifkan Penagihan Cloud.

Memantau penggunaan

Setelah mengaktifkan Penagihan Cloud, Anda dapat memantau penggunaan Gemini API di tindakan Konsol Google Cloud. Nama layanan untuk API adalah generativelanguage.googleapis.com, dan dalam konsol, Gemini API juga disebut sebagai Generative Language API.

Cloud Console

Untuk mempelajari lebih lanjut, lihat dokumentasi Google Cloud tentang pemantauan penggunaan API.

Pertanyaan umum (FAQ)

Bagian ini memberikan jawaban atas pertanyaan umum (FAQ).

Apa yang ditagih?

Harga Gemini API didasarkan pada hal berikut:

  • Jumlah token input
  • Jumlah token output
  • Jumlah token yang di-cache
  • Durasi penyimpanan token yang di-cache

Untuk mengetahui informasi harga, lihat halaman harga.

Di mana saya dapat melihat kuota saya?

Anda dapat melihat kuota dan batas sistem di Konsol Google Cloud.

Dapatkah saya menggunakan Gemini API secara gratis di EEA (termasuk Uni Eropa), Inggris Raya, dan Swiss?

Ada dua kumpulan model yang tersedia melalui API:

  1. Model berbayar yang mencakup Gemini 1.5 Flash, Gemini 1.5 Pro, dan Gemini 1.0 Kelebihan Model ini tidak akan memiliki paket gratis yang tersedia di EEA (termasuk Uni Eropa), Inggris Raya, dan Swiss. Developer harus melalui langkah-langkah yang diperlukan untuk menyiapkan akun penagihan dan membayar penggunaan.
  2. Model tertentu mungkin dapat diakses secara gratis di Gemini API. (Lihat ai.google.dev/pricing untuk mengetahui detail model yang kami kenakan biaya; model lainnya secara gratis). Namun, Anda tetap perlu menyiapkan akun untuk menggunakan model ini.

Jika saya menyiapkan penagihan dengan Gemini API, apakah saya akan dikenai biaya untuk penggunaan Google AI Studio saya?

Tidak, penggunaan Google AI Studio tetap tanpa biaya terlepas dari apakah Anda menyiapkannya penagihan di semua wilayah yang didukung termasuk EEA, Uni Eropa, Inggris Raya, dan Swiss.

Dapatkah saya menggunakan 1 juta token di paket gratis?

Paket gratis untuk Gemini API berbeda-beda berdasarkan model yang dipilih. Untuk saat ini, Anda dapat mencoba jendela konteks 1 juta token dengan cara berikut:

  • Di Google AI Studio
  • Dengan paket bayar sesuai penggunaan
  • Dengan paket tanpa biaya untuk model tertentu

Lihat batas kapasitas tanpa biaya terbaru per model di halaman harga.

Bagaimana cara menghitung jumlah token yang saya gunakan?

Menggunakan GenerativeModel.count_tokens untuk menghitung jumlah token. Lihat Panduan token untuk mempelajari token lebih lanjut.

Bagaimana penagihan ditangani?

Penagihan untuk Gemini API ditangani oleh Penagihan Cloud.

Apakah saya dikenai biaya untuk permintaan yang gagal?

Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya token yang digunakan. Namun, permintaan tersebut akan tetap mengurangi kuota Anda.

Apakah ada biaya untuk fine-tuning model?

Penyesuaian model tidak dikenai biaya, tetapi inferensi sesuai dengan dikenai tarif yang sama dengan model dasar.

Apakah GetTokens ditagih?

Permintaan ke GetTokens API tidak dikenai biaya, dan tidak diperhitungkan kuota inferensi.

Di mana saya bisa mendapatkan bantuan terkait penagihan?

Untuk mendapatkan bantuan terkait penagihan, lihat Dapatkan dukungan Penagihan Cloud.