Pratinjau Gemini 2.5 Pro kini tersedia untuk penggunaan produksi. Pelajari lebih lanjut

Halaman ini diterjemahkan oleh Cloud Translation API.

Model Gemini

2.5 Pro

Model pemikiran kami yang paling canggih dengan akurasi respons maksimum dan performa canggih

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Atasi masalah sulit, analisis database besar, dan lainnya
Terbaik untuk coding, penalaran, dan pemahaman multimodal yang kompleks

2.0 Flash

Model multimodal terbaru kami, dengan fitur generasi berikutnya dan kemampuan yang lebih baik

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Membuat kode dan gambar, mengekstrak data, menganalisis file, membuat grafik, dan lainnya
Latensi rendah, performa yang ditingkatkan, dibuat untuk mendukung pengalaman agentic

2.0 Flash-Lite

Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah

Memasukkan audio, gambar, video, dan teks, mendapatkan respons teks
Mengungguli 1.5 Flash di sebagian besar benchmark
Jendela konteks 1 juta token dan input multimodal, seperti Flash 2.0

Varian model

Gemini API menawarkan berbagai model yang dioptimalkan untuk kasus penggunaan tertentu. Berikut ringkasan singkat tentang varian Gemini yang tersedia:

Varian model	Input	Output	Dioptimalkan untuk
Pratinjau Gemini 2.5 Pro `gemini-2.5-pro-preview-03-25`	Audio, gambar, video, dan teks	Teks	Pemikiran dan penalaran yang ditingkatkan, pemahaman multimodal, coding lanjutan, dan lainnya
Gemini 2.0 Flash `gemini-2.0-flash`	Audio, gambar, video, dan teks	Teks, gambar (eksperimental), dan audio (segera hadir)	Fitur, kecepatan, pemikiran, streaming real-time, dan generasi multimodal generasi berikutnya
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Audio, gambar, video, dan teks	Teks	Efisiensi biaya dan latensi rendah
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, gambar, video, dan teks	Teks	Performa yang cepat dan serbaguna di berbagai tugas
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, gambar, video, dan teks	Teks	Tugas dengan volume tinggi dan kecerdasan yang lebih rendah
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, gambar, video, dan teks	Teks	Tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan
Penyematan Gemini `gemini-embedding-exp`	Teks	Embedding teks	Mengukur keterkaitan string teks
Imagen 3 `imagen-3.0-generate-002`	Teks	Gambar	Model pembuatan gambar kami yang paling canggih
Veo 2 `veo-2.0-generate-001`	Teks, gambar	Video	Pembuatan video berkualitas tinggi
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	Audio, video, dan teks	Teks, audio	Interaksi suara dan video dua arah dengan latensi rendah

Anda dapat melihat batas kapasitas untuk setiap model di halaman batas kapasitas.

Pratinjau Gemini 2.5 Pro

Gemini 2.5 Pro adalah model pemikiran canggih kami, yang mampu melakukan penalaran atas masalah kompleks dalam kode, matematika, dan STEM, serta menganalisis set data, codebase, dan dokumen dalam jumlah besar menggunakan konteks yang panjang.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	Berbayar: `gemini-2.5-pro-preview-03-25`, Eksperimental: `gemini-2.5-pro-exp-03-25`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 65,536
Kemampuan	Output terstruktur Didukung Menyimpan ke cache Tidak didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Pembumian penelusuran Didukung Pembuatan gambar Tidak didukung Penggunaan alat native Didukung Pembuatan audio Tidak didukung Live API Tidak didukung Berpikir Didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Pratinjau: `gemini-2.5-pro-preview-03-25` Eksperimental: `gemini-2.5-pro-exp-03-25`
Pembaruan terbaru	Maret 2025
Batas informasi	Januari 2025

Gemini 2.0 Flash

Gemini 2.0 Flash menghadirkan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang unggul, penggunaan alat native, pembuatan multimodal, dan jendela konteks 1 juta token.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-2.0-flash`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks, gambar (eksperimental), dan audio(segera hadir)
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Kemampuan	Output terstruktur Didukung Menyimpan ke cache Didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Penelusuran Didukung Pembuatan gambar Eksperimental Penggunaan alat native Didukung Pembuatan audio Segera hadir Live API Didukung Berpikir Eksperimental
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-2.0-flash` Stabil: `gemini-2.0-flash-001` Eksperimental: `gemini-2.0-flash-exp` dan `gemini-2.0-flash-exp-image-generation` mengarah ke model pokok yang sama Eksperimental: `gemini-2.0-flash-thinking-exp-01-21`
Pembaruan terbaru	Februari 2025
Batas informasi	Agustus 2024

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-2.0-flash-lite`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Kemampuan	Output terstruktur Didukung Menyimpan ke cache Tidak didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Tidak didukung Penelusuran Tidak didukung Pembuatan gambar Tidak didukung Penggunaan alat native Tidak didukung Pembuatan audio Tidak didukung Live API Tidak didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-2.0-flash-lite` Stabil: `gemini-2.0-flash-lite-001`
Pembaruan terbaru	Februari 2025
Batas informasi	Agustus 2024

Gemini 1.5 Flash

Gemini 1.5 Flash adalah model multimodal yang cepat dan serbaguna untuk melakukan penskalaan di berbagai tugas.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-flash`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung Live API Tidak didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-flash-latest` Stabil terbaru: `gemini-1.5-flash` Stabil: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Pembaruan terbaru	September 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B adalah model kecil yang dirancang untuk tugas kecerdasan yang lebih rendah.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-flash-8b`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 3.600 Durasi video maksimum 1 jam Durasi audio maksimum Sekitar 9,5 jam
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Didukung Panggilan fungsi Didukung Eksekusi kode Didukung Live API Tidak didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-flash-8b-latest` Stabil terbaru: `gemini-1.5-flash-8b` Stabil: `gemini-1.5-flash-8b-001`
Pembaruan terbaru	Oktober 2024

Gemini 1.5 Pro

Coba Gemini 2.0 Pro Eksperimental, model Gemini kami yang paling canggih hingga saat ini.

Gemini 1.5 Pro adalah model multimodal berukuran sedang yang dioptimalkan untuk berbagai tugas penalaran. 1.5 Pro dapat memproses data dalam jumlah besar sekaligus, termasuk video berdurasi 2 jam, audio berdurasi 19 jam, codebase dengan 60.000 baris kode, atau 2.000 halaman teks.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-1.5-pro`
Jenis data yang didukung	Input Audio, gambar, video, dan teks Output Teks
Batas token^[*]	Batas token input 2.097.152 Batas token output 8.192
Spesifikasi audio/visual	Jumlah maksimum gambar per perintah 7.200 Durasi video maksimum 2 jam Durasi audio maksimum Sekitar 19 jam
Kemampuan	Petunjuk sistem Didukung Mode JSON Didukung Skema JSON Didukung Setelan keamanan yang dapat disesuaikan Didukung Menyimpan ke cache Didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Live API Tidak didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Terbaru: `gemini-1.5-pro-latest` Stabil terbaru: `gemini-1.5-pro` Stabil: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Pembaruan terbaru	September 2024

Imagen 3

Imagen 3 adalah model text-to-image berkualitas terbaik kami, yang mampu menghasilkan gambar dengan detail yang lebih baik, pencahayaan yang lebih kaya, dan lebih sedikit artefak yang mengganggu dibandingkan model kami sebelumnya.

Detail model

Properti	Deskripsi
Kode model	Gemini API `imagen-3.0-generate-002`
Jenis data yang didukung	Input Teks Output Gambar
Batas token^[*]	Batas token input T/A Gambar output Hingga 4
Pembaruan terbaru	Februari 2025

Veo 2

Veo 2 adalah model teks dan gambar ke video berkualitas tinggi kami, yang mampu menghasilkan video mendetail, menangkap nuansa artistik dalam perintah Anda.

Detail model

Properti	Deskripsi
Kode model	Gemini API `veo-2.0-generate-001`
Jenis data yang didukung	Input Teks, gambar Output Video
Batas	Input teks T/A Input gambar Resolusi dan rasio aspek gambar apa pun hingga ukuran file 20 MB Video output Maksimal 2
Pembaruan terbaru	April 2025

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live berfungsi dengan Live API untuk memungkinkan interaksi suara dan video dua arah dengan latensi rendah dengan Gemini. Model ini dapat memproses input teks, audio, dan video, serta dapat memberikan output teks dan audio.

Coba di Google AI Studio

Detail model

Properti	Deskripsi
Kode model	`models/gemini-2.0-flash-live-001`
Jenis data yang didukung	Input Audio, video, dan teks Output Teks dan audio
Batas token^[*]	Batas token input 1.048.576 Batas token output 8.192
Kemampuan	Output terstruktur Didukung Menyimpan ke cache Tidak didukung Penyesuaian Tidak didukung Panggilan fungsi Didukung Eksekusi kode Didukung Penelusuran Didukung Pembuatan gambar Tidak didukung Penggunaan alat native Didukung Pembuatan audio Didukung Berpikir Tidak didukung
Versions	Baca pola versi model untuk mengetahui detail selengkapnya. Pratinjau: `gemini-2.0-flash-live-001`
Pembaruan terbaru	April 2025
Batas informasi	Agustus 2024

Eksperimental Penyisipan Gemini

Gemini embedding mencapai performa SOTA di banyak dimensi utama, termasuk kode, multibahasa, dan pengambilan.

Detail model

Properti	Deskripsi
Kode model	Gemini API `gemini-embedding-exp-03-07`
Jenis data yang didukung	Input Teks Output Embedding teks
Batas token^[*]	Batas token input 8.192 Ukuran dimensi output Elastis, mendukung: 3072, 1536, atau 768
Pembaruan terbaru	Maret 2025

Penyematan Teks dan Embedding

Penyematan Teks

Coba model penyematan Gemini eksperimental baru kami yang mencapai performa terbaik.

Embedding teks digunakan untuk mengukur keterkaitan string dan banyak digunakan di banyak aplikasi AI.

text-embedding-004 mencapai performa pengambilan yang lebih kuat dan mengungguli model yang ada dengan dimensi yang sebanding, pada benchmark penyematan MTEB standar.

Detail model

Properti	Deskripsi
Kode model	Gemini API `models/text-embedding-004`
Jenis data yang didukung	Input Teks Output Embedding teks
Batas token^[*]	Batas token input 2.048 Ukuran dimensi output 768
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Tidak didukung
Pembaruan terbaru	April 2024

Embedding

Anda dapat menggunakan model Embedding untuk membuat embedding teks untuk teks input.

Model Embedding dioptimalkan untuk membuat embedding dengan 768 dimensi untuk teks hingga 2.048 token.

Menyematkan detail model

Properti	Deskripsi
Kode model	`models/embedding-001`
Jenis data yang didukung	Input Teks Output Embedding teks
Batas token^[*]	Batas token input 2.048 Ukuran dimensi output 768
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Tidak didukung
Pembaruan terbaru	Desember 2023

AQA

Anda dapat menggunakan model AQA untuk melakukan tugas terkait Pembahasan Pertanyaan dengan Atribusi (AQA) pada dokumen, korpus, atau serangkaian bagian. Model AQA menampilkan jawaban atas pertanyaan yang didasarkan pada sumber yang diberikan, beserta estimasi probabilitas yang dapat dijawab.

Detail model

Properti	Deskripsi
Kode model	`models/aqa`
Jenis data yang didukung	Input Teks Output Teks
Bahasa yang didukung	Inggris
Batas token^[*]	Batas token input 7.168 Batas token output 1.024
Batas kapasitas^[**]	1.500 permintaan per menit
Setelan keamanan yang dapat disesuaikan	Didukung
Pembaruan terbaru	Desember 2023

Lihat contoh untuk mempelajari kemampuan variasi model ini.

[*] Token setara dengan sekitar 4 karakter untuk model Gemini. 100 token adalah sekitar 60-80 kata bahasa Inggris.

Pola nama versi model

Model Gemini tersedia dalam versi pratinjau, stabil, atau eksperimental. Dalam kode, Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin digunakan.

Stabil terbaru: Menunjuk ke versi stabil terbaru yang dirilis untuk variasi dan pembuatan model yang ditentukan.

Untuk menentukan versi stabil terbaru, gunakan pola berikut: <model>-<generation>-<variation>. Misalnya, gemini-2.0-flash.
Stabil: Menunjuk ke model stabil tertentu. Model stabil biasanya tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.

Untuk menentukan versi stabil, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-2.0-flash-001.
Pratinjau: Menunjuk ke model pratinjau yang mungkin tidak cocok untuk penggunaan produksi, tetapi mungkin mengaktifkan penagihan.

Untuk menentukan versi pratinjau, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-2.5-pro-preview-03-25.
Eksperimental: Menunjuk ke model eksperimental yang mungkin tidak cocok untuk penggunaan produksi. Kami merilis model eksperimental untuk mengumpulkan masukan dan memberikan update terbaru kepada developer dengan cepat.

Untuk menentukan versi eksperimental, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-2.0-pro-exp-02-05.

Model eksperimental

Selain model yang siap produksi, Gemini API menawarkan model eksperimental yang mungkin tidak cocok untuk penggunaan produksi.

Kami merilis model eksperimental untuk mengumpulkan masukan, menyampaikan update terbaru kepada developer dengan cepat, dan menyoroti kecepatan inovasi yang terjadi di Google. Hal yang kami pelajari dari peluncuran eksperimental ini akan menjadi dasar dalam merilis model secara lebih luas. Model eksperimental dapat diganti dengan model lain tanpa pemberitahuan sebelumnya. Kami tidak menjamin bahwa model eksperimental akan menjadi model yang stabil di masa mendatang.

Model eksperimental sebelumnya

Saat versi baru atau rilis stabil tersedia, kami akan menghapus dan mengganti model eksperimental. Anda dapat menemukan model eksperimental sebelumnya yang kami rilis di bagian berikut beserta versi penggantinya:

Kode model	Model dasar	Versi pengganti
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-exp-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Bahasa yang didukung

Model Gemini dilatih untuk berfungsi dengan bahasa berikut:

Arab (ar)
Bengali (bn)
Bulgaria (bg)
China (aksara sederhana dan tradisional) (zh)
Kroasia (hr)
Ceko (cs)
Denmark (da)
Belanda (nl)
Inggris (en)
Estonia (et)
Finlandia (fi)
Prancis (fr)
Jerman (de)
Yunani (el)
Ibrani (iw)
Hindi (hi)
Hungaria (hu)
Indonesia (id)
Italia (it)
Jepang (ja)
Korea (ko)
Latvia (lv)
Lituania (lt)
Norwegia (no)
Polandia (pl)
Portugis (pt)
Rumania (ro)
Rusia (ru)
Serbia (sr)
Slovakia (sk)
Slovenia (sl)
Spanyol (es)
Swahili (sw)
Swedia (sv)
Thai (th)
Turki (tr)
Ukraina (uk)
Vietnam (vi)