Gemini API ile ince ayarlar

Birkaç denemelik istem gibi istem tasarım stratejileri her zaman yardımcı olur. İnce ayarlama, modelinizin belirli görevlerdeki performansını artırabilecek veya talimatlar yeterli olmadığında ve istediğiniz çıktıları gösteren bir örnek grubunuz olduğunda modelin belirli çıkış koşullarına uymasına yardımcı olabilecek bir işlemdir.

Bu sayfada, Gemini API metin hizmetinin arkasındaki metin modelinde ince ayar yapma işlemine kavramsal bir genel bakış sunulmaktadır. Ayarlamaya başlamaya hazır olduğunuzda ince ayar eğitimi bölümünü deneyin. LLM'leri belirli kullanım alanları için özelleştirmeyle ilgili daha genel bir girişe göz atmak istiyorsanız Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği bölümüne göz atın.

İnce ayarların işleyiş şekli

İnce ayarlama işleminin amacı, modelin performansını belirli göreviniz için daha da iyileştirmektir. İnce ayar, modele görevin birçok örneğini içeren bir eğitim veri kümesi sağlayarak çalışır. Niş görevler için model üzerinde küçük bir ayarlamayla model performansında önemli artışlar izin verebilirsiniz. Bu tür model ayarlama işlemi, diğer hassas ayar türlerinden ayırt etmek için bazen gözetimli hassas ayarlama olarak adlandırılır.

Eğitim verileriniz, istem girişleri ve beklenen yanıt çıkışlarıyla örnekler olarak yapılandırılmalıdır. Modelleri doğrudan Google AI Studio'da örnek verileri kullanarak da ayarlayabilirsiniz. Amaç, modele istenen davranışı taklit etmeyi öğretmektir gösteren birçok örnek vererek daha iyi bir örnek verin.

Bir ayarlama işi çalıştırdığınızda model, istenen görevi gerçekleştirmek veya istenen davranışı öğrenmek için gerekli bilgileri kodlamasına yardımcı olan ek parametreler öğrenir. Bu parametreler daha sonra çıkarım sırasında kullanılabilir. Ayarlama işinin çıktısı, yeni öğrenilen parametrelerin ve orijinal modelin bir kombinasyonu olan yeni bir modeldir.

Veri kümenizi hazırlama

İnce ayar yapmaya başlamadan önce modeli ayarlamak için bir veri kümesine ihtiyacınız vardır. Örneğin, bağlantı varsa, veri kümesindeki örneklerin kalitesi yüksek, temsil eder ve gerçek giriş ve çıktıları temsil eder.

Biçim

Veri kümenize dahil edilen örnekler, beklenen üretim trafiğinizle eşleşmelidir. Veri kümenizde belirli biçimlendirmeler, anahtar kelimeler, talimatlar, üretim verileri de yine aynı şekilde biçimlendirilmiş olmalı ve aynı talimatları içermelidir.

Örneğin, veri kümenizdeki örnekler bir "question:" ve bir "context:", üretim trafiği de bir Veri kümesinde göründüğü sırayla "question:" ve bir "context:" örnekler. Bağlamı hariç tutarsanız model, tam soru veri kümesindeki bir örnekte yer alsa bile kalıbı tanıyamaz.

Başka bir örnek olarak, bir sıradaki sonraki sayıyı oluşturan bir uygulama için Python eğitim verilerini burada bulabilirsiniz:

training_data = [
  {"text_input": "1", "output": "2"},
  {"text_input": "3", "output": "4"},
  {"text_input": "-3", "output": "-2"},
  {"text_input": "twenty two", "output": "twenty three"},
  {"text_input": "two hundred", "output": "two hundred one"},
  {"text_input": "ninety nine", "output": "one hundred"},
  {"text_input": "8", "output": "9"},
  {"text_input": "-98", "output": "-97"},
  {"text_input": "1,000", "output": "1,001"},
  {"text_input": "10,100,000", "output": "10,100,001"},
  {"text_input": "thirteen", "output": "fourteen"},
  {"text_input": "eighty", "output": "eighty one"},
  {"text_input": "one", "output": "two"},
  {"text_input": "three", "output": "four"},
  {"text_input": "seven", "output": "eight"},
]

Veri kümenizdeki her bir örneğe bir istem veya önsöz eklemek de ayarlanmış modelin performansını artırmanıza yardımcı olabilir. Veri kümenize bir istem veya önsöz eklenmişse bu istemin, çıkarım sırasında ayarlanmış modele gönderilen istemde de yer alması gerektiğini unutmayın.

Sınırlamalar

Not: Gemini 1.5 Flash için veri kümelerinde ince ayarlamalar yapıldığında şunlar bulunur: sınırlamalar:

  • Örnek başına maksimum giriş boyutu 40.000 karakterdir.
  • Örnek başına maksimum çıkış boyutu 5.000 karakterdir.

Eğitim verisi boyutu

20 örnek kadar az sayıda örnek kullanarak bir modelde ince ayar yapabilirsiniz. Ek veriler genellikle yanıtların kalitesini artırır. 100 veya üzeri ve 500 örnek bulunuyor. Aşağıdaki tabloda, çeşitli yaygın görevler için bir metin modelinde ince ayar yapmak üzere önerilen veri kümesi boyutları gösterilmektedir:

Görev Veri kümesindeki örnek sayısı
Sınıflandırma 100+
Özetleme 100-500+
Doküman arama 100+

Tuning veri kümenizi yükleme

Veriler, API kullanılarak veya Google AI Studio'ya yüklenen dosyalar aracılığıyla satır içi olarak iletilir.

İstemci kitaplığını kullanmak için createTunedModel çağrısında veri dosyasını sağlayın. Dosya boyutu sınırı 4 MB'tır. Başlamak için Python ile hassas ayar hızlı başlangıç kılavuzuna göz atın.

REST API'yi cURL kullanarak çağırmak için training_data bağımsız değişken. Bkz. cURL ile ayarlama hızlı başlangıç kılavuzu seçerek başlayın.

Gelişmiş ince ayar ayarları

Ayarlama işi oluştururken aşağıdaki gelişmiş ayarları belirtebilirsiniz:

  • Dönemler: Tüm eğitim setini kapsayan tam bir eğitim geçişidir. Böylece, örnek bir kez işlendi.
  • Grup boyutu: Bir eğitim iterasyonunda kullanılan örnek grubu. Grup boyutu, bir gruptaki örnek sayısını belirler.
  • Öğrenme hızı: Algoritmaya her iterasyonda model parametrelerini ne kadar güçlü ayarlayacağını söyleyen kayan noktalı bir sayı. Örneğin, 0,3 öğrenme hızı, ağırlıkları ve önyargıları 0,1 öğrenme hızından üç kat daha güçlü bir şekilde ayarlar. Yüksek ve düşük öğrenme oranlarının kendine özgü avantajları ve dezavantajları vardır ve kullanım alanınıza göre ayarlanmalıdır.
  • Öğrenme oranı çarpanı: Ücret çarpanı, modelin öğrenme oranı. 1 değeri, modeli. 1'den büyük değerler öğrenme hızını ve 1 arasındaki değerleri artırır. öğrenme hızını düşürür.

Aşağıdaki tabloda, temel modelde ince ayar yapmak için önerilen yapılandırmalar gösterilmektedir:

Hiperparametre Varsayılan değer Önerilen ayarlamalar
Epoch 5

Kayıp, 5 dönemden önce platoya başlarsa daha küçük bir değer kullanın.

Kayıp yakınsamaya doğru gidiyorsa ve sabit bir değere ulaşmıyorsa daha yüksek bir değer kullanın.

Grup boyutu 4
Öğrenme hızı 0,001 Daha küçük veri kümeleri için daha küçük bir değer kullanın.

Kayıp eğrisi, modelin tahmininin ideal değerden ne kadar saptığını gösterir. tahminlerle ilgili daha fazla bilgi edinebilirsiniz. İdeal olarak, eğrinin düzleşmeden hemen önceki en düşük noktasında eğitimi durdurmak istersiniz. Örneğin, aşağıdaki grafikte kayıp eğrisinin yaklaşık 4-6. dönemde sabit bir seviyeye ulaştığı gösterilmektedir. Bu, Epoch parametresini 4'e ayarlasanız bile aynı performansı elde edebileceğiniz anlamına gelir.

Modelin kayıp eğrisini gösteren çizgi grafik. Çizgi, ilk ve ikinci dönemler arasında ani bir artış gösterir, ardından neredeyse 0'a kadar keskin bir düşüş yaşar ve üç dönem sonra düz bir çizgiye ulaşır.

Ayarlama işinin durumunu kontrol etme

Ayarlama işinizin durumunu Google AI Studio'daki şu bölümünden kontrol edebilirsiniz: Kitaplığım sekmesinden veyametadata Gemini API.

Hataları giderme

Bu bölümde, çalışırken karşılaşabileceğiniz hataların nasıl giderileceğine hassaslaştırılmış modelinizi oluşturun.

Kimlik doğrulama

API ve istemci kitaplığını kullanarak ince ayar yapmak için kimlik doğrulama gerekir. Kimlik doğrulamasını API anahtarı (önerilen) veya OAuth kimlik bilgileri kullanarak ayarlayabilirsiniz. API anahtarı ayarlamayla ilgili belgeler için bkz. API anahtarı ayarlama.

'PermissionDenied: 403 Request had insufficient authentication scopes' hatası görürseniz OAuth kullanarak kullanıcı kimlik doğrulamasını ayarlamanız gerekebilir. kimlik bilgileri. Python için OAuth kimlik bilgilerini yapılandırmak için şu sayfayı ziyaret edin: OAuth kurulum eğiticisini inceleyin.

İptal edilen modeller

İnce ayar işini, iş tamamlanmadan önce istediğiniz zaman iptal edebilirsiniz. Ancak, iptal edilen bir modelin çıkarım performansı öngörülemezdir, özellikle de ayarlama işi eğitimin başlarında iptal edilir. Üyeliğinizi eğitimi daha erken bir dönemde durdurmak isterseniz, daha düşük bir değere ayarlayabilirsiniz.

Ayarlanmış modellerle ilgili sınırlamalar

Not: Ayarlanmış modellerde aşağıdaki sınırlamalar geçerlidir:

  • Ayarlanmış Gemini 1.5 Flash modelinin giriş sınırı 40.000 karakterdir.
  • Hassaslaştırılmış modellerde JSON modu desteklenmez.
  • Yalnızca metin girişi desteklenir.

Sırada ne var?

İnce ayar eğiticileriyle başlayın: