Model Gemini

Varian model

Gemini API menawarkan berbagai model yang dioptimalkan untuk kasus penggunaan tertentu. Berikut ringkasan singkat tentang varian Gemini yang tersedia:

Varian model Input Output Dioptimalkan untuk
Flash Gemini 2.0
gemini-2.0-flash-exp
Audio, gambar, video, dan teks Teks, gambar (segera hadir), dan audio (segera hadir) Fitur, kecepatan, dan pembuatan multimodal generasi berikutnya untuk berbagai tugas
Gemini 1.5 Flash
gemini-1.5-flash
Audio, gambar, video, dan teks Teks Performa yang cepat dan serbaguna di berbagai tugas
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, gambar, video, dan teks Teks Tugas dengan volume tinggi dan kecerdasan yang lebih rendah
Gemini 1.5 Pro
gemini-1.5-pro
Audio, gambar, video, dan teks Teks Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan
(Tidak digunakan lagi pada 15/02/2025) Gemini 1.0 Pro
gemini-1.0-pro
Teks Teks Tugas bahasa alami, teks multiturn dan chat kode, serta pembuatan kode
Penyematan Teks
text-embedding-004
Teks Embedding teks Mengukur keterkaitan string teks
AQA
aqa
Teks Teks Memberikan jawaban yang didasarkan pada sumber atas pertanyaan

(Eksperimental) Gemini 2.0 Flash

Gemini 2.0 Flash menghadirkan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang unggul, penggunaan alat native, pembuatan multimodal, dan jendela konteks 1 juta token. Pelajari Gemini 2.0 Flash lebih lanjut di halaman ringkasan kami.

Coba di Google AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-2.0-flash-exp
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Audio (segera hadir), gambar (segera hadir), dan teks

Batas token[*]

Batas token input

1.048.576

Batas token output

8.192

Batas kapasitas[**]
  • 10 RPM
  • 4 juta TPM
  • 1.500 RPD
Kemampuan

Output terstruktur

Didukung

Menyimpan ke cache

Tidak didukung

Penyesuaian

Tidak didukung

Panggilan fungsi

Didukung

Eksekusi kode

Didukung

Penelusuran

Didukung

Pembuatan gambar

Didukung

Penggunaan alat native

Didukung

Pembuatan audio

Didukung

Versions
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Terbaru: gemini-2.0-flash-exp
Pembaruan terbaru Desember 2024

Gemini 1.5 Flash

Gemini 1.5 Flash adalah model multimodal yang cepat dan serbaguna untuk penskalaan di berbagai tugas.

Mencoba di Google AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.5-flash
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Teks

Batas token[*]

Batas token input

1.048.576

Batas token output

8.192

Spesifikasi audio/visual

Jumlah maksimum gambar per perintah

3.600

Durasi video maksimum

1 jam

Durasi audio maksimum

Sekitar 9,5 jam

Batas kapasitas[**]
Gratis:
  • 15 RPM
  • 1 juta TPM
  • 1.500 RPD
Pay-as-you-go:
  • 2.000 RPM
  • 4 juta TPM
Kemampuan

Petunjuk sistem

Didukung

Mode JSON

Didukung

Skema JSON

Didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Didukung

Penyesuaian

Didukung

Panggilan fungsi

Didukung

Eksekusi kode

Didukung

Streaming dua arah

Tidak didukung

Versions
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Terbaru: gemini-1.5-flash-latest
  • Stabil terbaru: gemini-1.5-flash
  • Stabil:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Pembaruan terbaru September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B adalah model kecil yang dirancang untuk tugas kecerdasan yang lebih rendah.

Coba di Google AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.5-flash-8b
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Teks

Batas token[*]

Batas token input

1.048.576

Batas token output

8.192

Spesifikasi audio/visual

Jumlah maksimum gambar per perintah

3.600

Durasi video maksimum

1 jam

Durasi audio maksimum

Sekitar 9,5 jam

Batas kapasitas[**]
Gratis:
  • 15 RPM
  • 1 juta TPM
  • 1.500 RPD
Pay-as-you-go:
  • 4.000 RPM
  • 4 juta TPM
Kemampuan

Petunjuk sistem

Didukung

Mode JSON

Didukung

Skema JSON

Didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Didukung

Penyesuaian

Didukung

Panggilan fungsi

Didukung

Eksekusi kode

Didukung

Streaming dua arah

Tidak didukung

Versions
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Terbaru: gemini-1.5-flash-8b-latest
  • Stabil terbaru: gemini-1.5-flash-8b
  • Stabil:
    • gemini-1.5-flash-8b-001
Pembaruan terbaru Oktober 2024

Gemini 1.5 Pro

Gemini 1.5 Pro adalah model multimodal berukuran sedang yang dioptimalkan untuk berbagai tugas penalaran. 1.5 Pro dapat memproses data dalam jumlah besar sekaligus, termasuk video berdurasi 2 jam, audio berdurasi 19 jam, codebase dengan 60.000 baris kode, atau 2.000 halaman teks.

Coba di Google AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.5-pro
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Teks

Batas token[*]

Batas token input

2.097.152

Batas token output

8.192

Spesifikasi audio/visual

Jumlah maksimum gambar per perintah

7.200

Durasi video maksimum

2 jam

Durasi audio maksimum

Sekitar 19 jam

Batas kapasitas[**]
Gratis:
  • 2 RPM
  • 32.000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1.000 RPM
  • 4 juta TPM
Kemampuan

Petunjuk sistem

Didukung

Mode JSON

Didukung

Skema JSON

Didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Didukung

Penyesuaian

Tidak didukung

Panggilan fungsi

Didukung

Eksekusi kode

Didukung

Streaming dua arah

Tidak didukung

Versions
Baca pola versi model untuk mengetahui detail selengkapnya.
  • Terbaru: gemini-1.5-pro-latest
  • Stabil terbaru: gemini-1.5-pro
  • Stabil:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Pembaruan terbaru September 2024

(Tidak digunakan lagi) Gemini 1.0 Pro

Gemini 1.0 Pro adalah model NLP yang menangani tugas seperti teks multi-turn dan chat kode, serta pembuatan kode.

Coba di Google AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.0-pro
Jenis data yang didukung

Input

Teks

Output

Teks

Batas kapasitas[**]
Gratis:
  • 15 RPM
  • 32.000 TPM
  • 1.500 RPD
Pay-as-you-go:
  • 360 RPM
  • 120.000 TPM
  • 30.000 RPD
Kemampuan

Petunjuk sistem

Tidak didukung

Mode JSON

Tidak didukung

Skema JSON

Tidak didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Tidak didukung

Penyesuaian

Didukung

Panggilan fungsi

Didukung

Konfigurasi panggilan fungsi

Tidak didukung

Eksekusi kode

Tidak didukung

Streaming dua arah

Tidak didukung

Versions
  • Terbaru: gemini-1.0-pro-latest
  • Stabil terbaru: gemini-1.0-pro
  • Stabil: gemini-1.0-pro-001
Pembaruan terbaru Februari 2024

Penyematan Teks dan Embedding

Penyematan Teks

Embedding teks digunakan untuk mengukur keterkaitan string dan banyak digunakan di banyak aplikasi AI.

text-embedding-004 mencapai performa pengambilan yang lebih kuat dan mengungguli model yang ada dengan dimensi yang sebanding, pada benchmark penyematan MTEB standar.

Detail model
Properti Deskripsi
Kode model

Gemini API

models/text-embedding-004

Jenis data yang didukung

Input

Teks

Output

Embedding teks

Batas token[*]

Batas token input

2.048

Ukuran dimensi output

768

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Tidak didukung
Pembaruan terbaru April 2024

Embedding

Anda dapat menggunakan model Embedding untuk menghasilkan embedding teks untuk teks input.

Model Embedding dioptimalkan untuk membuat embedding dengan 768 dimensi untuk teks hingga 2.048 token.

Menyematkan detail model
Properti Deskripsi
Kode model models/embedding-001
Jenis data yang didukung

Input

Teks

Output

Embedding teks

Batas token[*]

Batas token input

2.048

Ukuran dimensi output

768

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Tidak didukung
Pembaruan terbaru Desember 2023

AQA

Anda dapat menggunakan model AQA untuk melakukan tugas terkait Pembahasan Pertanyaan dengan Atribusi (AQA) pada dokumen, korpus, atau sekumpulan bagian. Model AQA menampilkan jawaban atas pertanyaan yang didasarkan pada sumber yang diberikan, beserta estimasi probabilitas yang dapat dijawab.

Detail model

Properti Deskripsi
Kode model models/aqa
Jenis data yang didukung

Input

Teks

Output

Teks

Bahasa yang didukung Inggris
Batas token[*]

Batas token input

7.168

Batas token output

1.024

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Didukung
Pembaruan terbaru Desember 2023

Lihat contoh untuk mempelajari kemampuan variasi model ini.

[*] Token setara dengan sekitar 4 karakter untuk model Gemini. 100 token adalah sekitar 60-80 kata bahasa Inggris.

[**] RPM: Permintaan per menit
TPM: Token per menit
RPD: Permintaan per hari
TPD: Token per hari

Karena batasan kapasitas, batas kapasitas maksimum yang ditentukan tidak dijamin.

Pola nama versi model

Model Gemini tersedia dalam versi pratinjau atau stabil. Dalam kode, Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin Anda gunakan.

  • Terbaru: Menunjuk ke versi model terbaru untuk pembuatan dan variasi tertentu. Model yang mendasarinya diperbarui secara rutin dan mungkin merupakan versi pratinjau. Hanya aplikasi dan prototipe pengujian eksplorasi yang harus menggunakan alias ini.

    Untuk menentukan versi terbaru, gunakan pola berikut: <model>-<generation>-<variation>-latest. Misalnya, gemini-1.0-pro-latest.

  • Stabil terbaru: Menunjuk ke versi stabil terbaru yang dirilis untuk variasi dan pembuatan model yang ditentukan.

    Untuk menentukan versi stabil terbaru, gunakan pola berikut: <model>-<generation>-<variation>. Misalnya, gemini-1.0-pro.

  • Stabil: Menunjuk ke model stabil tertentu. Model stabil tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.

    Untuk menentukan versi stabil, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.0-pro-001.

  • Eksperimental: Menunjuk ke model eksperimental yang tersedia di Pratinjau, seperti yang ditentukan dalam Persyaratan, yang berarti model tersebut tidak untuk penggunaan produksi. Kami merilis model eksperimental untuk mengumpulkan masukan, memberikan update terbaru kepada developer dengan cepat, dan menyoroti kecepatan inovasi yang terjadi di Google. Hal yang kami pelajari dari peluncuran eksperimental akan menentukan cara kami merilis model secara lebih luas. Model eksperimental dapat diganti dengan model lain tanpa pemberitahuan sebelumnya. Kami tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.

    Untuk menentukan versi eksperimental, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-exp-1121.

Bahasa yang tersedia

Model Gemini dilatih untuk berfungsi dengan bahasa berikut:

  • Arab (ar)
  • Bengali (bn)
  • Bulgaria (bg)
  • China (aksara sederhana dan tradisional) (zh)
  • Kroasia (hr)
  • Ceko (cs)
  • Denmark (da)
  • Belanda (nl)
  • Inggris (en)
  • Estonia (et)
  • Finlandia (fi)
  • Prancis (fr)
  • Jerman (de)
  • Yunani (el)
  • Ibrani (iw)
  • Hindi (hi)
  • Hungaria (hu)
  • Indonesia (id)
  • Italia (it)
  • Jepang (ja)
  • Korea (ko)
  • Latvia (lv)
  • Lituania (lt)
  • Norwegia (no)
  • Polandia (pl)
  • Portugis (pt)
  • Rumania (ro)
  • Rusia (ru)
  • Serbia (sr)
  • Slovakia (sk)
  • Slovenia (sl)
  • Spanyol (es)
  • Swahili (sw)
  • Swedia (sv)
  • Thai (th)
  • Turki (tr)
  • Ukraina (uk)
  • Vietnam (vi)