Memerlukan biaya untuk membantu Anda memperkenalkan aplikasi Anda kepada dunia
Tersedia sekarang
Tersedia sekarang
Tersedia sekarang
Model multimodal tercepat kami dengan performa luar biasa untuk beragam tugas berulang dan satu juta jendela konteks. Sekarang tersedia secara umum untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
15 RPM (permintaan per menit)
1 juta TPM (token per menit)
1.500 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan cache konteks
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
1.000 RPM (permintaan per menit)
4 juta TPM (token per menit)
Harga (input)
$0,35 / 1 juta token (untuk perintah hingga 128 ribu token)
$0,70 / 1 juta token (untuk prompt lebih dari 128 ribu)
Penyimpanan cache konteks
$0,0875 / 1 juta token (untuk perintah hingga 128 ribu token)
$0,175 / 1 juta token (untuk prompt lebih dari 128 ribu)
$1,00 / 1 juta token per jam (penyimpanan)
Harga (output)
$1,05 / 1 juta token (untuk prompt hingga 128 ribu token)
$2,10 / 1 juta token (untuk prompt lebih dari 128 ribu)
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
Model generasi berikutnya dengan terobosan 2 juta jendela konteks. Sekarang tersedia secara umum untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
2 RPM (permintaan per menit)
32.000 TPM (token per menit)
50 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan cache konteks
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
360 RPM (permintaan per menit)
4 juta TPM (token per menit)
10.000 RPD (permintaan per hari)
Harga (input)
$3,50 / 1 juta token (untuk prompt hingga 128 ribu token)
$7,00 / 1 juta token (untuk prompt lebih dari 128 ribu)
Penyimpanan cache konteks
$0,875 / 1 juta token (untuk perintah hingga 128 ribu token)
$1,75 / 1 juta token (untuk prompt lebih dari 128 ribu)
$4,50 / 1 juta token per jam (penyimpanan)
Harga (output)
$10,50 / 1 juta token (untuk perintah hingga 128 ribu token)
$21,00 / 1 juta token (untuk prompt lebih dari 128 ribu)
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
Model generasi pertama kami hanya menawarkan penalaran teks dan gambar. Secara umum tersedia untuk penggunaan produksi.
Tanpa biaya*
Batas Kapasitas**
15 RPM (permintaan per menit)
32.000 TPM (token per menit)
1.500 RPD (permintaan per hari)
Harga (input)
Tanpa biaya
Penyimpanan cache konteks
Tidak berlaku
Harga (output)
Tanpa biaya
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Bayar sesuai penggunaan (harga dalam USD)***
Batas Kapasitas**
360 RPM (permintaan per menit)
120.000 TPM (token per menit)
30.000 RPD (permintaan per hari)
Harga (input)
$0,50 / 1 juta token
Penyimpanan cache konteks
Tidak tersedia
Harga (output)
$1,50 / 1 juta token
Perintah/respons yang digunakan untuk meningkatkan kualitas produk kami
Tidak
*Batasan penggunaan paket gratis Gemini API berlaku untuk EEA (termasuk Uni Eropa), Inggris Raya, dan Swiss. Lihat FAQ Penagihan untuk mengetahui detailnya.
**Batas kapasitas yang ditentukan tidak dijamin dan kapasitas sebenarnya dapat bervariasi. Ajukan permohonan untuk meningkatkan batas kapasitas maksimum (khusus paket berbayar).
***Biaya inferensi model yang disesuaikan ditagih dengan harga yang sama dengan model dasar. Untuk mendapatkan bantuan terkait penagihan, lihat Dukungan Penagihan Cloud.
****Harga mungkin berbeda dari harga yang tercantum di sini dan harga yang ditawarkan di Vertex AI. Untuk mengetahui harga Vertex, lihat dokumentasi Vertex.
Bangun dengan Vertex AI di Google Cloud