Model Gemini

Gemini adalah kelompok model AI generatif yang memungkinkan developer membuat konten dan memecahkan masalah. Model ini dirancang dan dilatih untuk menangani teks dan gambar sebagai input. Panduan ini memberikan informasi tentang setiap varian model untuk membantu Anda memutuskan mana yang paling sesuai untuk kasus penggunaan Anda.

Berikut ringkasan model yang tersedia beserta kemampuannya:

Model Input Output
Gemini
  • Gemini 1.5 Pro (Khusus pratinjau)
Teks dan gambar Teks
  • Gemini 1.0 Pro
Teks Teks
  • Gemini 1.0 Pro Vision
Teks dan gambar Teks
Embedding
  • Embedding
Teks Embedding teks
Pengambilan
  • AQA (AQA)
Teks Teks

Keselamatan dan tujuan penggunaan

Model kecerdasan buatan generatif adalah alat yang canggih, tetapi tidak tanpa batasan. Fleksibilitas dan keberlakuannya terkadang dapat menyebabkan output yang tidak terduga, seperti output yang tidak akurat, bias, atau menyinggung. Pasca-pemrosesan, dan evaluasi manual yang ketat sangat penting untuk membatasi risiko bahaya dari output tersebut. Lihat panduan keamanan untuk saran penggunaan aman tambahan.

Model yang disediakan oleh Gemini API dapat digunakan untuk berbagai aplikasi AI generatif dan natural language processing (NLP). Penggunaan fungsi ini hanya tersedia melalui Gemini API atau aplikasi web Google AI Studio. Penggunaan Anda atas Gemini API juga tunduk pada Kebijakan Penggunaan Terlarang AI Generatif dan Persyaratan layanan Gemini API.

Ukuran model

Tabel berikut menunjukkan ukuran yang tersedia dan artinya jika dibandingkan satu sama lain.

Ukuran model Deskripsi Layanan
Gemini 1.0 Pro Ukuran model yang menyeimbangkan kemampuan dan efisiensi.
  • teks
  • chat

Versi model

Model Gemini tersedia dalam versi pratinjau atau stabil. Dalam kode, Anda dapat menggunakan salah satu format nama model berikut untuk menentukan model dan versi yang ingin digunakan.

  • Terbaru: Mengarah ke model versi mutakhir untuk generasi dan variasi tertentu. Model yang mendasarinya diperbarui secara teratur dan mungkin versi pratinjau. Hanya aplikasi dan prototipe pengujian eksploratif yang boleh menggunakan alias ini.

    Untuk menentukan versi terbaru, gunakan pola berikut: <model>-<generation>-<variation>-latest. Misalnya, gemini-1.0-pro-latest.

  • Stabil terbaru: Mengarah ke versi stabil terbaru yang dirilis untuk pembuatan dan variasi model yang ditentukan.

    Untuk menentukan versi stabil terbaru, gunakan pola berikut: <model>-<generation>-<variation>. Misalnya, gemini-1.0-pro.

  • Stabil: Mengarah ke model stabil tertentu. Model stabil tidak berubah. Sebagian besar aplikasi produksi harus menggunakan model stabil tertentu.

    Untuk menentukan versi stabil, gunakan pola berikut: <model>-<generation>-<variation>-<version>. Misalnya, gemini-1.0-pro-001.

Untuk model yang memiliki versi stabil, lihat baris "Nama model" untuk model dalam Variasi model.

Variasi model

Gemini API menawarkan berbagai model yang dioptimalkan untuk kasus penggunaan tertentu. Tabel berikut menjelaskan atribut dari setiap atribut.

Variasi Atribut Deskripsi
Gemini 1.5 Pro (Khusus pratinjau) Model terakhir diperbarui April 2024
Kode model models/gemini-1.5-pro-latest
Kemampuan model
  • Input: audio, gambar, teks
  • Output: teks
  • Dioptimalkan untuk tugas bahasa seperti:
    • Pembuatan kode
    • Pembuatan teks
    • Pengeditan teks
    • Pemecahan masalah
    • Pembuatan rekomendasi
    • Ekstraksi informasi
    • Ekstraksi atau pembuatan data
    • Agen AI
  • Dapat menangani tugas zero, one, dan few-shot.
Metode pembuatan yang didukung generateContent
Batas token input 1048576
Batas token output 8192
Keamanan model Setelan keamanan yang diterapkan secara otomatis yang dapat disesuaikan oleh developer. Lihat topik setelan keamanan untuk mengetahui detailnya.
Batas kapasitas 2 kueri per menit, 1.000 kueri per hari [1]
Gemini Model terakhir diperbarui Februari 2024
Kode model models/gemini-pro
Kemampuan model
  • Input: teks
  • Output: teks
  • Menghasilkan teks.
  • Dapat menangani format percakapan multi-giliran.
  • Dapat menangani tugas zero, one, dan few-shot.
Metode pembuatan yang didukung generateContent
Batas token input 30720
Batas token output 2048
Keamanan model Setelan keamanan yang diterapkan secara otomatis yang dapat disesuaikan oleh developer. Lihat topik setelan keamanan untuk mengetahui detailnya.
Batas kapasitas 60 permintaan per menit [1]
Nama model
  • Versi terbaru: gemini-1.0-pro-latest
  • Versi stabil terbaru: gemini-1.0-pro
  • Versi stabil:
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision Model terakhir diperbarui Desember 2023
Kode model models/gemini-pro-vision
Kemampuan model
  • Input: teks dan gambar
  • Output: teks
  • Dapat menerima input multimodal, teks dan gambar.
  • Dapat menangani tugas zero, one, dan few-shot.
Metode pembuatan yang didukung generateContent
Batas token input 12288
Batas token output 4096
Keamanan model Setelan keamanan yang diterapkan secara otomatis yang dapat disesuaikan oleh developer. Lihat topik setelan keamanan untuk mengetahui detailnya.
Batas kapasitas 60 permintaan per menit [1]
Embedding Model terakhir diperbarui Desember 2023
Kode model models/embedding-001
Kemampuan model
  • Input: teks
  • Output: teks
  • Menghasilkan embedding teks untuk teks input.
  • Dioptimalkan untuk membuat embedding untuk teks hingga 2048 token.
Metode pembuatan yang didukung embedContent
Keamanan model Tidak ada setelan keamanan yang dapat disesuaikan.
Batas kapasitas 1.500 permintaan per menit [1]
Penyematan Teks Model terakhir diperbarui April 2024
Kode model models/text-embedding-004 (text-embedding-preview-0409 di Vertex AI)
Kemampuan model
  • Input: teks
  • Output: teks
  • Menghasilkan embedding teks untuk teks input.
  • Mendukung ukuran embedding elastis di bawah 768.
Metode pembuatan yang didukung embedContent
Keamanan model Tidak ada setelan keamanan yang dapat disesuaikan.
Batas kapasitas 1.500 permintaan per menit [1]
AQA (AQA) Model terakhir diperbarui Desember 2023
Kode model models/aqa
Kemampuan model
  • Input: teks
  • Output: teks
  • Model yang melakukan Penjawaban Pertanyaan yang Diatribusikan.
  • Model yang dilatih untuk mengembalikan jawaban atas pertanyaan yang didasarkan pada sumber yang disediakan, bersama dengan memperkirakan probabilitas yang dapat dijawab.
Metode pembuatan yang didukung generateAnswer
Bahasa yang didukung Inggris
Batas token input 7168
Batas token output 1024
Keamanan model Setelan keamanan yang diterapkan secara otomatis yang dapat disesuaikan oleh developer. Lihat topik setelan keamanan untuk mengetahui detailnya.
Batas kapasitas 60 permintaan per menit [1]

Lihat contoh untuk mempelajari kemampuan variasi model ini.

Metadata model

Gunakan ModelService API untuk mendapatkan metadata tambahan tentang model terbaru seperti batas token input dan output. Tabel berikut menampilkan metadata untuk varian model Gemini Pro.

Atribut Nilai
Nama tampilan Gemini 1.0 Pro
Kode model models/gemini-1.0-pro
Deskripsi Model yang ditargetkan untuk pembuatan teks
Metode pembuatan yang didukung generateContent
Temperature (suhu) 0,9
top_p 1
top_k 1

Atribut model

Tabel berikut menjelaskan atribut model Gemini yang umum untuk semua variasi model.

Atribut Deskripsi
Data pelatihan Batas pengetahuan Gemini adalah awal tahun 2023. Pengetahuan tentang peristiwa setelah waktu tersebut dibatasi.
Bahasa yang didukung Melihat bahasa yang tersedia
Parameter model yang dapat dikonfigurasi
  • P teratas
  • K teratas
  • Temperature (suhu)
  • Hentikan urutan
  • Panjang output maks
  • Jumlah kandidat respons

[1] Karena keterbatasan kapasitas, batas kapasitas maksimum yang ditentukan tidak dijamin.

Lihat bagian parameter model dalam panduan Pengantar LLM untuk mengetahui informasi tentang setiap parameter ini.

Langkah berikutnya