Model Gemini

Varian model

Gemini API menawarkan berbagai model yang dioptimalkan untuk penggunaan tertentu penggunaan. Berikut ringkasan singkat tentang varian Gemini yang tersedia:

Varian model Input Output Dioptimalkan untuk
Flash Gemini 1.5
gemini-1.5-flash
Audio, gambar, video, dan teks Teks Performa cepat dan serbaguna untuk berbagai tugas
Gemini 1.5 Pro
gemini-1.5-pro
Audio, gambar, video, dan teks Teks Tugas penalaran yang kompleks seperti pembuatan kode dan pembuatan teks, pengeditan teks, pemecahan masalah, ekstraksi dan pembuatan data
Gemini 1.0 Pro
gemini-1.0-pro
Teks Teks Tugas bahasa alami, teks multi-giliran dan chat kode, serta kode pembuatan
Penyematan Teks
text-embedding-004
Teks Embedding teks Mengukur keterkaitan {i>string<i} teks
AQA
aqa
Teks Teks Memberikan jawaban berdasarkan sumber untuk pertanyaan

Tabel berikut menjelaskan atribut model Gemini yang umum untuk semua varian model:

Atribut Deskripsi
Data pelatihan Batas pengetahuan Gemini adalah November 2023. Pengetahuan tentang acara setelah waktu tersebut dibatasi.
Bahasa yang didukung Melihat bahasa yang tersedia
Parameter model yang dapat dikonfigurasi
  • Hal teratas
  • Top K
  • Suhu
  • Hentikan urutan
  • Panjang output maksimum
  • Jumlah kandidat respons

Lihat parameter model bagian dari panduan model generatif untuk mendapatkan informasi tentang setiap parameter ini.

Flash Gemini 1.5

Gemini 1.5 Flash adalah model multimodal yang cepat dan serbaguna untuk melakukan penskalaan beragam tugas.

Coba di AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.5-flash
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Teks

Batas token[*]

Batas token input

1.048.576

Batas token output

8.192.

Spesifikasi audio/visual

Jumlah maksimum gambar per perintah

3.600

Durasi video maksimum

1 jam

Durasi audio maksimum

Sekitar 9,5 jam

Batas kapasitas[**]
Gratis:
  • 15 RPM
  • 1 juta TPM
  • 1.500 RPD
Pay-as-you-go:
  • 1.000 RPM
  • 4 juta TPM
Capabilities

Petunjuk sistem

Didukung

Mode JSON

Didukung

Skema JSON

Didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Didukung

Penyesuaian

Didukung

Panggilan fungsi

Didukung

Konfigurasi panggilan fungsi

Didukung

Eksekusi kode

Didukung

Versi
  • Terbaru: gemini-1.5-flash-latest
  • Stabil terbaru: gemini-1.5-flash
  • Stabil: gemini-1.5-flash-001
  • Eksperimental:
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
Perubahan terbaru Mei 2024

Gemini 1.5 Pro

Gemini 1.5 Pro adalah model multimodal skala menengah yang dioptimalkan untuk berbagai tugas penalaran. 1.5 Pro dapat memproses data dalam jumlah besar sekaligus, termasuk 2 jam video, 19 jam audio, basis kode dengan 60.000 baris kode atau 2.000 halaman teks.

Coba di AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.5-pro
Jenis data yang didukung

Input

Audio, gambar, video, dan teks

Output

Teks

Batas token[*]

Batas token input

2.097.152

Batas token output

8.192.

Spesifikasi audio/visual

Jumlah maksimum gambar per perintah

7.200

Durasi video maksimum

2 jam

Durasi audio maksimum

Sekitar 19 jam

Batas kapasitas[**]
Gratis:
  • 2 RPM
  • 32.000 TPM
  • 50 RPD
Pay-as-you-go:
  • RPM 360
  • 4 juta TPM
Capabilities

Petunjuk sistem

Didukung

Mode JSON

Didukung

Skema JSON

Didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Didukung

Penyesuaian

Tidak didukung

Panggilan fungsi

Didukung

Konfigurasi panggilan fungsi

Didukung

Eksekusi kode

Didukung

Versi
  • Terbaru: gemini-1.5-pro-latest
  • Stabil terbaru: gemini-1.5-pro
  • Stabil: gemini-1.5-pro-001
  • Eksperimental:
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
Perubahan terbaru Mei 2024

Gemini 1.0 Pro

Gemini 1.0 Pro adalah model NLP yang menangani tugas seperti teks multi-giliran {i>code chat<i}, dan pembuatan kode.

Coba di AI Studio

Detail model

Properti Deskripsi
Kode model models/gemini-1.0-pro
Jenis data yang didukung

Input

Teks

Output

Teks

Batas kapasitas[**]
Gratis:
  • 15 RPM
  • 32.000 TPM
  • 1.500 RPD
Pay-as-you-go:
  • RPM 360
  • 120.000 TPM
  • 30.000 RPD
Capabilities

Petunjuk sistem

Tidak didukung

Mode JSON

Tidak didukung

Skema JSON

Tidak didukung

Setelan keamanan yang dapat disesuaikan

Didukung

Menyimpan ke cache

Tidak didukung

Penyesuaian

Didukung

Panggilan fungsi

Didukung

Konfigurasi panggilan fungsi

Tidak didukung

Eksekusi kode

Tidak didukung

Versi
  • Terbaru: gemini-1.0-pro-latest
  • Stabil terbaru: gemini-1.0-pro
  • Stabil: gemini-1.0-pro-001
Perubahan terbaru Februari 2024

Penyematan dan Penyematan Teks

Penyematan Teks

Penyematan teks digunakan untuk mengukur keterkaitan string dan banyak digunakan dalam banyak aplikasi AI.

text-embedding-004 mencapai performa pengambilan yang lebih kuat dan mengungguli model yang ada dengan dimensi yang sebanding, pada tolok ukur penyematan MTEB standar.

Detail model
Properti Deskripsi
Kode model

API Gemini

models/text-embedding-004

Jenis data yang didukung

Input

Teks

Output

Embedding teks

Batas token[*]

Batas token input

2.048

Ukuran dimensi output

768

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Tidak didukung
Perubahan terbaru April 2024

Embedding

Anda dapat menggunakan model Penyematan untuk membuat embedding teks untuk teks input.

Model Embedding dioptimalkan untuk membuat embeddings dengan dimensi 768 untuk teks hingga 2.048 token.

Detail model penyematan
Properti Deskripsi
Kode model models/embedding-001
Jenis data yang didukung

Input

Teks

Output

Embedding teks

Batas token[*]

Batas token input

2.048

Ukuran dimensi output

768

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Tidak didukung
Perubahan terbaru Desember 2023

AQA

Anda dapat menggunakan model AQA untuk melakukan Pertanyaan-Pertanyaan yang Diatribusikan (AQA)–tugas terkait pada dokumen, korpus, atau serangkaian bagian. AQA mengembalikan jawaban atas pertanyaan berdasarkan sumber yang diberikan, bersama dengan memperkirakan probabilitas yang dapat dijawab.

Detail model

Properti Deskripsi
Kode model models/aqa
Jenis data yang didukung

Input

Teks

Output

Teks

Bahasa yang didukung Inggris
Batas token[*]

Batas token input

7.168.

Batas token output

1.024

Batas kapasitas[**] 1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan Didukung
Perubahan terbaru Desember 2023

Lihat contoh untuk mempelajari kemampuan model ini variasi.

[*] Token setara dengan sekitar 4 karakter untuk model Gemini. 100 token berisi sekitar 60-80 kata dalam bahasa Inggris.

[**] RPM: Permintaan per menit
TPM: Token per menit
RPD: Permintaan per hari
TPD: Token per hari

Karena keterbatasan kapasitas, batas kapasitas maksimum yang ditentukan tidak dijamin efektif.

Pola nama versi model

Model Gemini tersedia dalam versi pratinjau atau stabil. Di Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin digunakan.

  • Terbaru: Mengarah ke versi terbaru model untuk pembuatan dan variasi. Model dasar di-update secara teratur dan mungkin menjadi versi pratinjau. Hanya aplikasi dan prototipe pengujian eksploratif yang boleh gunakan alias ini.

    Untuk menentukan versi terbaru, gunakan pola berikut: <model>-<generation>-<variation>-latest. Misalnya, gemini-1.0-pro-latest.

  • Stabil terbaru: Mengarah ke versi stabil terbaru yang dirilis untuk pembuatan dan variasi model yang telah ditentukan.

    Untuk menentukan versi stabil terbaru, gunakan pola berikut: <model>-<generation>-<variation>. Misalnya, gemini-1.0-pro.

  • Stabil: Mengarah ke model stabil tertentu. Model stabil tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.

    Untuk menentukan versi stabil, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.0-pro-001.

  • Eksperimental: Mengarah ke model eksperimental yang tersedia di Pratinjau. sebagaimana didefinisikan dalam Persyaratan, artinya bukan untuk penggunaan produksi. Kami merilis model eksperimental guna mengumpulkan masukan, mengirimkan update terbaru kami ke tangan developer dengan cepat, dan menyoroti laju inovasi yang terjadi di Google. Apa yang kami pelajari dari peluncuran eksperimental akan memberi tahu cara kami merilis model secara luas. Model eksperimental dapat ditukar dengan model lain tanpa pemberitahuan. Kami tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.

    Untuk menentukan versi eksperimental, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.5-pro-exp-0801.

Bahasa yang tersedia

Model Gemini dilatih untuk bekerja dengan bahasa berikut:

  • Arab (ar)
  • Bengali (bn)
  • Bulgaria (bg)
  • China (aksara sederhana dan tradisional) (zh)
  • Kroasia (hr)
  • Ceko (cs)
  • Denmark (da)
  • Belanda (nl)
  • Inggris (en)
  • Estonia (et)
  • Finlandia (fi)
  • Prancis (fr)
  • Jerman (de)
  • Yunani (el)
  • Ibrani (iw)
  • Hindi (hi)
  • Hungaria (hu)
  • Indonesia (id)
  • Italia (it)
  • Jepang (ja)
  • Korea (ko)
  • Latvia (lv)
  • Lituania (lt)
  • Norwegia (no)
  • Polandia (pl)
  • Portugis (pt)
  • Rumania (ro)
  • Rusia (ru)
  • Serbia (sr)
  • Slovakia (sk)
  • Slovenia (sl)
  • Spanyol (es)
  • Swahili (sw)
  • Swedia (sv)
  • Thai (th)
  • Turki (tr)
  • Ukraina (uk)
  • Vietnam (vi)