Gemini

Gemini, geliştiricilerin içerik oluşturmasına ve sorunları çözmesine olanak tanıyan bir üretken yapay zeka modelleri ailesidir. Bu modeller hem metin hem de resimleri giriş olarak işleyecek şekilde tasarlanmış ve eğitilmiştir. Bu kılavuzda, kullanım alanınıza en uygun seçeneği belirlemenize yardımcı olmak amacıyla her model varyantı hakkında bilgiler verilmektedir.

Güvenlik ve kullanım amacı

Üretken yapay zeka modelleri güçlü araçlardır ancak bunlarla sınırlı değildir. Çok yönlülükleri ve uygulanabilirlikleri bazen yanlış, taraflı veya rahatsız edici çıktılar gibi beklenmedik çıktılara yol açabilir. İşleme sonrası ve titizlikle yapılan manuel değerlendirmeler, bu tür çıktıların yol açtığı zarar riskini sınırlamak için çok önemlidir. Güvenli kullanımla ilgili ek öneriler için güvenlik kılavuzunu inceleyin.

Gemini API tarafından sağlanan modeller, çok çeşitli üretken yapay zeka ve doğal dil işleme (NLP) uygulamalarında kullanılabilir. Bu işlevlerin kullanımı yalnızca Gemini API veya Google AI Studio web uygulaması üzerinden yapılabilir. Gemini API kullanımınız, Üretken Yapay Zeka Yasaklanan Kullanım Politikası ve Gemini API hizmet şartlarına da tabidir.

Model varyantları

Gemini API, belirli kullanım alanları için optimize edilmiş farklı modeller sunar. Kullanılabilir Gemini varyantlarına kısa bir genel bakışı burada bulabilirsiniz:

Model varyantı Giriş(ler) Çıkış Optimizasyon amacı
Gemini 1.5 Pro (Önizleme) Ses, resim ve metin Metin Kod ve metin oluşturma, metin düzenleme, sorun çözme, veri ayıklama ve oluşturma dahil ancak bunlarla sınırlı olmamak üzere akıl yürütme görevleri
Gemini 1.5 Flash (Önizleme) Ses, resim ve metin Metin Çeşitli görevlerde hızlı ve çok yönlü performans
Gemini 1.0 Pro Metin Metin Doğal dil görevleri, çok dönüşlü metin ve kod sohbeti ve kod oluşturma
Gemini 1.0 Pro Vision Resimler ve metin Metin Görsel açıklamaları oluşturma veya resimlerdeki nesneleri tanımlama gibi görsel görevler için optimize edilmiş performans
Metin Yerleştirme Metin Metin yerleştirme 2.048 jetona kadar metinler için 768'e kadar boyuta sahip esnek metin yerleştirmeleri oluşturun
Yerleştirme Metin Metin yerleştirme 2.048 simgeye kadar metinler için 768 boyutlu metin yerleştirmeleri oluşturun
KG Metin Metin Sağlanan metin üzerinden ilişkilendirilen Question-Answering ile ilgili görevleri gerçekleştirme

Aşağıdaki tabloda, tüm model varyantlarında ortak olan Gemini modellerinin özellikleri açıklanmaktadır:

Özellik Açıklama
Eğitim verileri Gemini'da son bilgi tarihi 2023'ün başlarında. Bu tarihten sonraki etkinlikler hakkında bilgi sınırlıdır.
Desteklenen diller Kullanılabilir dilleri görme
Yapılandırılabilir model parametreleri
  • Üst p
  • İlk k
  • Sıcaklık
  • Adım sırasını durdur
  • Maksimum çıkış uzunluğu
  • Yanıt adaylarının sayısı

Bu parametrelerin her biri hakkında bilgi almak için üretken modeller kılavuzunun model parametreleri bölümüne bakın.

Gemini 1.5 Pro (Önizleme)

Gemini 1.5 Pro, aşağıdakiler gibi çok çeşitli akıl yürütme görevleri için optimize edilmiş orta büyüklükte bir çok modlu modeldir:

  • Kod oluşturma
  • Metin oluşturma
  • Metin düzenleme
  • Problem çözme
  • Öneri oluşturma
  • Bilgi ayıklama
  • Veri ayıklama veya oluşturma
  • AI aracıları oluşturma

1.5 Pro, 1 saatlik video, 9,5 saatlik ses, 30.000'den fazla kod satırı ya da 700.000'den fazla kelime içeren kod tabanları da dahil olmak üzere aynı anda büyük miktarda veri işleyebilir.

1.5 Pro sıfır, tek ve az çekim gerektiren öğrenim görevlerini yerine getirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-1.5-pro-latest
Girişler Ses, resim ve metin
Çıkış Metin
Desteklenen oluşturma yöntemleri generateContent
Giriş jetonu sınırı[**] 1.048.576
Çıkış jetonu sınırı[**] 8.192
İstem başına maksimum resim sayısı 3.600
Maksimum video uzunluğu 1 saat
Maksimum ses uzunluğu Yaklaşık 9,5 saat
İstem başına maksimum ses dosyası sayısı 1
Model güvenliği Geliştiriciler tarafından ayarlanabilen, otomatik olarak uygulanan güvenlik ayarları. Ayrıntılar için güvenlik ayarları sayfamıza bakın.
Hız sınırları[*]
Ücretsiz:
  • 2 devir/dk.
  • 32.000 TPM
  • 50 RPD
  • 46.080.000 TPD
Pay-as-you-go:
  • 360 devir/dk.
  • 10 milyon TPM
  • 10.000 RPD
  • 14.400.000.000 TPD
İki milyon bağlam:
  • 1 devir/dk.
  • 2 milyon TPM
  • 50 RPD
Sistem talimatları Destekleniyor
JSON modu Destekleniyor
Son sürüm gemini-1.5-pro-latest
En son kararlı sürüm gemini-1.5-pro
Son güncelleme Nisan 2024

Gemini 1.5 Flash (Önizleme)

Gemini 1.5 Flash, çeşitli görevlerde ölçeklendirme için hızlı ve çok yönlü bir çok modlu modeldir.

Model ayrıntıları

Özellik Açıklama
Model kodu gemini-1.5-flash
Giriş(ler) Ses, resim ve metin
Çıkış Metin
Desteklenen oluşturma yöntemleri generateContent
Giriş jetonu sınırı[**] 1.048.576
Çıkış jetonu sınırı[**] 8.192
İstem başına maksimum resim sayısı 3.600
Maksimum video uzunluğu 1 saat
Maksimum ses uzunluğu Yaklaşık 9,5 saat
İstem başına maksimum ses dosyası sayısı 1
Model güvenliği Geliştiriciler tarafından ayarlanabilen, otomatik olarak uygulanan güvenlik ayarları. Ayrıntılar için güvenlik ayarları sayfamıza bakın.
Hız sınırları[*]
Ücretsiz:
  • 15 devir/dk.
  • 1 milyon TPM
  • 1.500 RPD
Pay-as-you-go:
  • 360 devir/dk.
  • 10 milyon TPM
  • 10.000 RPD
Sistem talimatları Destekleniyor
JSON modu Destekleniyor
Son sürüm gemini-1.5-flash-latest
En son kararlı sürüm gemini-1.5-flash

Gemini 1.0 Pro

Gemini 1.0 Pro, çok dönüşlü metin, kod sohbeti ve kod oluşturma gibi görevleri işleyen bir NLP modelidir.

1.0 Pro sıfır, tek ve az çekim gerektiren öğrenim görevlerini yerine getirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-pro
Giriş Metin
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: generate_content
REST: generateContent
Hız sınırları[*]
Ücretsiz:
  • 15 devir/dk.
  • 32.000 TPM
  • 1.500 RPD
  • 46.080.000 TPD
Pay-as-you-go:
  • 360 devir/dk.
  • 120.000 TPM
  • 30.000 RPD
  • 172.800.000 TPD
Sistem talimatları Desteklenmiyor
JSON modu Desteklenmiyor
Son sürüm gemini-1.0-pro-latest
En son kararlı sürüm gemini-1.0-pro
Kararlı sürümler gemini-1.0-pro-001
Son güncelleme Şubat 2024

Gemini 1.0 Pro Vizyonu

Gemini 1.0 Pro Vision, görsel görevleri gerçekleştirebilen, performans açısından optimize edilmiş çok modlu bir modeldir. Örneğin 1.0 Pro Vision, resim açıklamaları oluşturabilir, resimlerdeki nesneleri tanımlayabilir, resimlerdeki yerler veya nesneler hakkında bilgi verebilir ve daha fazlasını yapabilir.

1.0 Pro Vision sıfır, tek ve az çekim gerektiren görevleri yerine getirebilir.

Model ayrıntıları

Özellik Açıklama
Model kodu models/gemini-pro-vision
Girişler Metin ve resimler
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: generate_content
REST: generateContent
Giriş jetonu sınırı[*] 12.288
Çıkış jetonu sınırı[*] 4.096
Maksimum resim boyutu Sınır yok
İstem başına maksimum resim sayısı 16
Maksimum video uzunluğu 2 dakika
İstem başına maksimum video sayısı 1
Model güvenliği Geliştiriciler tarafından ayarlanabilen, otomatik olarak uygulanan güvenlik ayarları. Ayrıntılar için güvenlik ayarları sayfamıza bakın.
Oran sınırı[*] Dakikada 60 istek
Son sürüm gemini-1.0-pro-vision-latest
En son kararlı sürüm gemini-1.0-pro-vision
Son güncelleme Aralık 2023

Metin Yerleştirme ve Gömme

Metin Yerleştirme

Giriş metni için metin yerleştirmeler oluşturmak amacıyla Metin Yerleştirme modelini kullanabilirsiniz. Metin Yerleştirme modeli hakkında daha fazla bilgi için metin yerleştirme hakkındaki Vertex AI'da Üretken AI belgelerini inceleyin.

Metin Yerleştirme modeli,en fazla 2.048 jetonluk metinler için 768 boyutlu yerleştirmeler oluşturmak üzere optimize edilmiştir. Metin Yerleştirme, 768'in altında esnek yerleştirme boyutları sunar. Esnek yerleştirmeleri kullanarak daha küçük çıktı boyutları oluşturabilir, bilgi işlem ve depolama maliyetlerinden küçük performans kaybıyla tasarruf edebilirsiniz.

Model ayrıntıları
Özellik Açıklama
Model kodu models/text-embedding-004 (Vertex AI'da text-embedding-preview-0409)
Giriş Metin
Çıkış Metin yerleştirme
Jeton sınırı girin 2.048
Çıkış boyutu boyutu 768
Desteklenen oluşturma yöntemleri
Python: embed_content
REST: embedContent
Model güvenliği Değiştirilebilir güvenlik ayarı yok.
Oran sınırı[*] Dakikada 1.500 istek
Son güncelleme Nisan 2024

Yerleştirme

Yerleştirme modelini, giriş metni için metin yerleştirmeler oluşturmak amacıyla kullanabilirsiniz.

Yerleştirme modeli,en fazla 2.048 jetonluk metinler için 768 boyutlu yerleştirmeler oluşturmak üzere optimize edilmiştir.

Model ayrıntıları yerleştiriliyor
Özellik Açıklama
Model kodu models/embedding-001
Giriş Metin
Çıkış Metin yerleştirme
Jeton sınırı girin 2.048
Çıkış boyutu boyutu 768
Desteklenen oluşturma yöntemleri
Python: embed_content
REST: embedContent
Model güvenliği Değiştirilebilir güvenlik ayarı yok.
Oran sınırı[*] Dakikada 1.500 istek
Son güncelleme Aralık 2023

KKG

AQA modelini bir belge, topluluk veya pasaj dizisi üzerinde Attributed Question-Answering (AQA) ile ilgili görevleri gerçekleştirmek için kullanabilirsiniz. AQA modeli, yanıtlanabilir olasılığı tahmin etmeyle birlikte, sağlanan kaynaklara dayanan soruların yanıtlarını döndürür.

Model ayrıntıları

Özellik Açıklama
Model kodu models/aqa
Giriş Metin
Çıkış Metin
Desteklenen oluşturma yöntemleri
Python: GenerateAnswerRequest
REST: generateAnswer
Desteklenen diller İngilizce
Giriş jetonu sınırı[**] 7.168
Çıkış jetonu sınırı[**] 1.024
Model güvenliği Geliştiriciler tarafından ayarlanabilen, otomatik olarak uygulanan güvenlik ayarları. Ayrıntılar için güvenlik ayarları sayfamıza bakın.
Oran sınırı[*] Dakikada 60 istek
Son güncelleme Aralık 2023

Bu model varyasyonlarının özelliklerini keşfetmek için örneklere bakın.

[*] Jeton, Gemini modellerinde yaklaşık 4 karaktere eşdeğerdir. 100 jeton yaklaşık 60-80 İngilizce kelimedir.

[**] BGBG: Dakika başına istek sayısı
TPM: Dakika başına jeton sayısı
RPD: Günlük istek sayısı
TPD: Günlük jeton sayısı

Kapasite sınırlamaları nedeniyle, belirtilen maksimum hız sınırları garanti edilmez.

Model sürümü adı kalıpları

Gemini modelleri önizleme veya kararlı sürümlerde kullanılabilir. Kodunuzda, kullanmak istediğiniz modeli ve sürümü belirtmek için aşağıdaki model adı biçimlerinden birini kullanabilirsiniz.

  • En son: Belirli bir nesil ve varyasyon için modelin en son sürümüne işaret eder. Temel model düzenli olarak güncellenir ve önizleme sürümü olabilir. Bu takma ad, yalnızca keşif amaçlı test uygulamaları ve prototipler tarafından kullanılmalıdır.

    En son sürümü belirtmek için şu kalıbı kullanın: <model>-<generation>-<variation>-latest. Örneğin, gemini-1.0-pro-latest.

  • En son kararlı: Belirtilen model üretimi ve varyasyonu için yayınlanan en son kararlı sürüme yönlendirme yapar.

    En son kararlı sürümü belirtmek için aşağıdaki kalıbı kullanın: <model>-<generation>-<variation>. Örneğin, gemini-1.0-pro.

  • Kararlı: Belirli bir kararlı modele işaret eder. Kararlı modeller değişmez. Çoğu üretim uygulaması belirli bir kararlı model kullanmalıdır.

    Kararlı bir sürüm belirtmek için şu kalıbı kullanın: <model>-<generation>-<variation>-<version>. Örneğin, gemini-1.0-pro-001.