Perujukan dengan Google Penelusuran kini tersedia. Pelajari lebih lanjut

Halaman ini diterjemahkan oleh Cloud Translation API.

Model Gemini

1.5 Flash

Model multimodal kami yang paling seimbang dengan performa yang luar biasa untuk sebagian besar tugas

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Membuat kode, mengekstrak data, mengedit teks, dan lainnya
Paling cocok untuk tugas yang menyeimbangkan performa dan biaya

1,5 Flash-8B

Model multimodal tercepat dan paling hemat biaya dengan performa yang luar biasa untuk tugas frekuensi tinggi

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Membuat kode, mengekstrak data, mengedit teks, dan lainnya
Paling cocok untuk tugas frekuensi tinggi dengan kecerdasan yang lebih rendah

1.5 Pro

Model multimodal berperforma terbaik kami dengan fitur untuk berbagai tugas penalaran

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Membuat kode, mengekstrak data, mengedit teks, dan lainnya
Untuk saat Anda memerlukan peningkatan performa

Varian model

Gemini API menawarkan berbagai model yang dioptimalkan untuk kasus penggunaan tertentu. Berikut ringkasan singkat tentang varian Gemini yang tersedia:

Varian model	Input	Output	Dioptimalkan untuk
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, gambar, video, dan teks	Teks	Performa yang cepat dan serbaguna di berbagai tugas
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, gambar, video, dan teks	Teks	Tugas dengan volume tinggi dan kecerdasan yang lebih rendah
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, gambar, video, dan teks	Teks	Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan
Gemini 1.0 Pro (Tidak digunakan lagi pada 15/02/2025) `gemini-1.0-pro`	Teks	Teks	Tugas bahasa alami, teks multiturn dan chat kode, serta pembuatan kode
Penyematan Teks `text-embedding-004`	Teks	Embedding teks	Mengukur keterkaitan string teks
AQA `aqa`	Teks	Teks	Memberikan jawaban yang didasarkan pada sumber atas pertanyaan

Gemini 1.5 Flash

Gemini 1.5 Flash adalah model multimodal yang cepat dan serbaguna untuk penskalaan di berbagai tugas.

Coba di AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-flash`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam
Batas kapasitas^[**]	Gratis: 15 RPM 1 juta TPM 1.500 RPD Pay-as-you-go: 2.000 RPM 4 juta TPM
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-flash-latest` Stabil terbaru: `gemini-1.5-flash` Stabil: `gemini-1.5-flash-001` `gemini-1.5-flash-002` Eksperimental: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
Pembaruan terbaru	September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B adalah model kecil yang dirancang untuk tugas kecerdasan yang lebih rendah.

Coba di AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-flash-8b`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam
Batas kapasitas^[**]	Gratis: 15 RPM 1 juta TPM 1.500 RPD Pay-as-you-go: 4.000 RPM 4 juta TPM
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-flash-8b-latest` Stabil terbaru: `gemini-1.5-flash-8b` Stabil: `gemini-1.5-flash-8b-001`
Pembaruan terbaru	Oktober 2024

Gemini 1.5 Pro

Gemini 1.5 Pro adalah model multimodal berukuran sedang yang dioptimalkan untuk berbagai tugas penalaran. 1.5 Pro dapat memproses data dalam jumlah besar sekaligus, termasuk video berdurasi 2 jam, audio berdurasi 19 jam, codebase dengan 60.000 baris kode, atau 2.000 halaman teks.

Coba di AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-pro`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 2.097.152 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 7.200 Durasi video maksimum 2 jam Durasi audio maksimum Sekitar 19 jam
Batas kapasitas^[**]	Gratis: 2 RPM 32.000 TPM 50 RPD Pay-as-you-go: 1.000 RPM 4 juta TPM
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-pro-latest` Stabil terbaru: `gemini-1.5-pro` Stabil: `gemini-1.5-pro-001` `gemini-1.5-pro-002` Eksperimental: `gemini-1.5-pro-exp-0827`
Pembaruan terbaru	September 2024

Gemini 1.0 Pro (Tidak digunakan lagi)

Gemini 1.0 Pro adalah model NLP yang menangani tugas seperti teks multi-turn dan chat kode, serta pembuatan kode.

Coba di AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.0-pro`
Jenis data yang didukung	Input Teks Output Teks
Batas kapasitas^[**]	Gratis: 15 RPM 32.000 TPM 1.500 RPD Pay-as-you-go: 360 RPM 120.000 TPM 30.000 RPD
Kemampuan	Petunjuk sistem Tidak didukung Mode JSON Tidak didukung Skema JSON Tidak didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Tidak didukung Penyesuaian Didukung Panggilan fungsi Didukung Konfigurasi panggilan fungsi Tidak didukung Eksekusi kode Tidak didukung
Versions	Terbaru: `gemini-1.0-pro-latest` Stabil terbaru: `gemini-1.0-pro` Stabil: `gemini-1.0-pro-001`
Pembaruan terbaru	Februari 2024

Catatan: gemini-pro adalah alias untuk gemini-1.0-pro.

Penyematan Teks dan Embedding

Penyematan Teks

Embedding teks digunakan untuk mengukur keterkaitan string dan banyak digunakan di banyak aplikasi AI.

text-embedding-004 mencapai performa pengambilan yang lebih kuat dan mengungguli model yang ada dengan dimensi yang sebanding, pada benchmark penyematan MTEB standar.

Detail model

Properti	Deskripsi
Kode model	Gemini API `models/text-embedding-004`
Jenis data yang didukung	Input Teks Output Embedding teks
Batas token^[*]	Batas token input 2.048 Ukuran dimensi output 768
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Tidak didukung
Pembaruan terbaru	April 2024

Embedding

Anda dapat menggunakan model Embedding untuk menghasilkan embedding teks untuk teks input.

Model Embedding dioptimalkan untuk membuat embedding dengan 768 dimensi untuk teks hingga 2.048 token.

Menyematkan detail model

Properti	Deskripsi
Kode model	`models/embedding-001`
Jenis data yang didukung	Input Teks Output Embedding teks
Batas token^[*]	Batas token input 2.048 Ukuran dimensi output 768
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Tidak didukung
Pembaruan terbaru	Desember 2023

AQA

Anda dapat menggunakan model AQA untuk melakukan tugas terkait Pembahasan Pertanyaan dengan Atribusi (AQA) pada dokumen, korpus, atau sekumpulan bagian. Model AQA menampilkan jawaban atas pertanyaan yang didasarkan pada sumber yang diberikan, beserta estimasi probabilitas yang dapat dijawab.

Detail model

Properti	Deskripsi
Kode model	`models/aqa`
Jenis data yang didukung	Input Teks Output Teks
Bahasa yang didukung	Inggris
Batas token^[*]	Batas token input 7.168 Batas token output 1.024
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Didukung
Pembaruan terbaru	Desember 2023

Lihat contoh untuk mempelajari kemampuan variasi model ini.

[*] Token setara dengan sekitar 4 karakter untuk model Gemini. 100 token adalah sekitar 60-80 kata dalam bahasa Inggris.

[**] RPM: Permintaan per menit
TPM: Token per menit
RPD: Permintaan per hari
TPD: Token per hari

Karena batasan kapasitas, batas kapasitas maksimum yang ditentukan tidak dijamin.

Pola nama versi model

Model Gemini tersedia dalam versi pratinjau atau stabil. Dalam kode, Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin digunakan.

Terbaru: Menunjuk ke versi model terbaru untuk pembuatan dan variasi tertentu. Model yang mendasarinya diperbarui secara rutin dan mungkin merupakan versi pratinjau. Hanya aplikasi dan prototipe pengujian eksplorasi yang harus menggunakan alias ini.

Untuk menentukan versi terbaru, gunakan pola berikut: <model>-<generation>-<variation>-latest. Misalnya, gemini-1.0-pro-latest.
Stabil terbaru: Menunjuk ke versi stabil terbaru yang dirilis untuk variasi dan pembuatan model yang ditentukan.

Untuk menentukan versi stabil terbaru, gunakan pola berikut: <model>-<generation>-<variation>. Misalnya, gemini-1.0-pro.
Stabil: Menunjuk ke model stabil tertentu. Model stabil tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.

Untuk menentukan versi stabil, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.0-pro-001.
Eksperimental: Menunjuk ke model eksperimental yang tersedia di Pratinjau, seperti yang ditentukan dalam Persyaratan, yang berarti model tersebut tidak untuk penggunaan produksi. Kami merilis model eksperimental untuk mengumpulkan masukan, memberikan update terbaru kepada developer dengan cepat, dan menyoroti kecepatan inovasi yang terjadi di Google. Hal yang kami pelajari dari peluncuran eksperimental akan menentukan cara kami merilis model secara lebih luas. Model eksperimental dapat diganti dengan model lain tanpa pemberitahuan sebelumnya. Kami tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.

Untuk menentukan versi eksperimental, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.5-pro-exp-0827.

Bahasa yang tersedia

Model Gemini dilatih untuk digunakan dengan bahasa berikut:

Arab (ar)
Bengali (bn)
Bulgaria (bg)
China (aksara sederhana dan tradisional) (zh)
Kroasia (hr)
Ceko (cs)
Denmark (da)
Belanda (nl)
Inggris (en)
Estonia (et)
Finlandia (fi)
Prancis (fr)
Jerman (de)
Yunani (el)
Ibrani (iw)
Hindi (hi)
Hungaria (hu)
Indonesia (id)
Italia (it)
Jepang (ja)
Korea (ko)
Latvia (lv)
Lituania (lt)
Norwegia (no)
Polandia (pl)
Portugis (pt)
Rumania (ro)
Rusia (ru)
Serbia (sr)
Slovakia (sk)
Slovenia (sl)
Spanyol (es)
Swahili (sw)
Swedia (sv)
Thai (th)
Turki (tr)
Ukraina (uk)
Vietnam (vi)