Birkaç denemelik istem gibi istem tasarım stratejileri her zaman yardımcı olur. İnce ayarlama, modelinizin belirli görevlerdeki performansını artırabilecek veya talimatlar yeterli olmadığında ve istediğiniz çıktıları gösteren bir örnek grubunuz olduğunda modelin belirli çıkış koşullarına uymasına yardımcı olabilecek bir işlemdir.
Bu sayfada, arka plandaki metin modelinde ince ayar yapmaya ilişkin kavramsal bir genel bakış sunulmaktadır. Gemini API metin hizmetiyle Ayarlamaya başlamaya hazır olduğunuzda ince ayar eğitimi bölümünü deneyin. LLM'leri belirli kullanım alanları için özelleştirmeyle ilgili daha genel bir girişe göz atmak istiyorsanız Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği bölümüne göz atın.
İnce ayarların işleyiş şekli
İnce ayarlama işleminin amacı, modelin performansını belirli göreviniz için daha da iyileştirmektir. İnce ayar, modele görevin birçok örneğini içeren bir eğitim veri kümesi sağlayarak çalışır. Niş görevler için modeli az sayıda örnekle ayarlayarak model performansında önemli iyileştirmeler elde edebilirsiniz. Bu tür model ayarlama işlemi, diğer hassas ayar türlerinden ayırt etmek için bazen gözetimli hassas ayarlama olarak adlandırılır.
Eğitim verileriniz, istem girişlerine ve ek açıklamaların yer aldığı en iyi uygulamaları paylaşacağız. Doğrudan örnek verileri kullanarak da modellerde ince ayar yapabilirsiniz. ekleyebilirsiniz. Amaç, modele istenen davranışı taklit etmeyi öğretmektir gösteren birçok örnek vererek daha iyi bir örnek verin.
Bir ince ayar işi çalıştırdığınızda model, işin tamamlanmasına yardımcı olan ek parametreler öğrenir istenen görevi gerçekleştirmek veya isteneni öğrenmek için gerekli bilgileri kodlamak gösterir. Bu parametreler, daha sonra çıkarım zamanında kullanılabilir. Çıktı ayarlama işi, yeni ve mevcut trafiğin etkili bir şekilde bir birleşimi olan öğrenilen parametreler ve orijinal model.
Veri kümenizi hazırlama
İnce ayar yapmaya başlamadan önce modeli ayarlamak için bir veri kümesine ihtiyacınız vardır. Örneğin, bağlantı varsa, veri kümesindeki örneklerin kalitesi yüksek, temsil eder ve gerçek giriş ve çıktıları temsil eder.
Biçim
Veri kümenize dahil edilen örnekler, beklediğiniz üretimle eşleşmelidir yardımcı olur. Veri kümenizde belirli biçimlendirmeler, anahtar kelimeler, talimatlar, üretim verileri de yine aynı şekilde biçimlendirilmiş olmalı ve aynı talimatları içermelidir.
Örneğin, veri kümenizdeki örneklerde bir "question:"
ve bir "context:"
varsa üretim trafiği de veri kümesi örneklerinde göründüğü sırayla bir "question:"
ve bir "context:"
içerecek şekilde biçimlendirilmelidir. Bağlamı hariç tutarsanız model, tam soru veri kümesindeki bir örnekte yer alsa bile kalıbı tanıyamaz.
Başka bir örnek olarak, bir dizide sonraki sayıyı oluşturur:
training_data = [
{"text_input": "1", "output": "2"},
{"text_input": "3", "output": "4"},
{"text_input": "-3", "output": "-2"},
{"text_input": "twenty two", "output": "twenty three"},
{"text_input": "two hundred", "output": "two hundred one"},
{"text_input": "ninety nine", "output": "one hundred"},
{"text_input": "8", "output": "9"},
{"text_input": "-98", "output": "-97"},
{"text_input": "1,000", "output": "1,001"},
{"text_input": "10,100,000", "output": "10,100,001"},
{"text_input": "thirteen", "output": "fourteen"},
{"text_input": "eighty", "output": "eighty one"},
{"text_input": "one", "output": "two"},
{"text_input": "three", "output": "four"},
{"text_input": "seven", "output": "eight"},
]
Veri kümenizdeki her bir örneğe bir istem veya önsöz eklemek de ayarlanmış modelin performansını artırmanıza yardımcı olabilir. Veri kümenize bir istem veya önsöz eklenmişse bu istemin, çıkarım sırasında ayarlanmış modele gönderilen istemde de yer alması gerektiğini unutmayın.
Sınırlamalar
Not: Gemini 1.5 Flash için veri kümelerinde ince ayarlamalar yapıldığında şunlar bulunur: sınırlamalar:
- Örnek başına maksimum giriş boyutu 40.000 karakterdir.
- Örnek başına maksimum çıkış boyutu 5.000 karakterdir.
Eğitim verileri boyutu
20 örnek kadar az sayıda örnek kullanarak bir modelde ince ayar yapabilirsiniz. Ek veriler genellikle yanıtların kalitesini artırır. 100 veya üzeri ve 500 örnek bulunuyor. Aşağıdaki tabloda Metin modelinde çeşitli yaygın görevlere yönelik ince ayarlar yapmak için önerilen veri kümesi boyutları şunlardır:
Görev | Veri kümesindeki örnek sayısı |
---|---|
Sınıflandırma | 100+ |
Özetleme | 100-500+ |
Doküman arama | 100+ |
Tuning veri kümenizi yükleme
Veriler, API kullanılarak veya Google AI Studio'ya yüklenen dosyalar aracılığıyla satır içi olarak iletilir.
İstemci kitaplığını kullanmak için createTunedModel
çağrısında veri dosyasını sağlayın.
Dosya boyutu sınırı 4 MB'tır. Bkz.
Python ile ince ayar hızlı başlangıç kılavuzu
seçerek başlayın.
REST API'yi cURL kullanarak çağırmak için
training_data
bağımsız değişken. Başlamak için cURL ile ayarlama hızlı başlangıç kılavuzuna göz atın.
Gelişmiş ince ayar ayarları
Ayarlama işi oluştururken aşağıdaki gelişmiş ayarları belirtebilirsiniz:
- Dönemler: Tüm eğitim setini kapsayan tam bir eğitim geçişidir. Böylece, örnek bir kez işlendi.
- Grup boyutu: Bir eğitim iterasyonunda kullanılan örnek grubu. İlgili içeriği oluşturmak için kullanılan grup boyutu bir gruptaki örnek sayısını belirler.
- Öğrenme hızı: Algoritmaya her iterasyonda model parametrelerini ne kadar güçlü ayarlayacağını söyleyen kayan noktalı bir sayı. Örneğin, 0,3 olan bir öğrenme hızı, ağırlıkları ve yanlılıkları üç kat daha fazla ayarlar daha güçlü olduğunu söylüyor. Yüksek ve düşük öğrenme oranları, kendine özgü dengeleri vardır ve kullanım alanınıza göre ayarlanmalıdır.
- Öğrenme hızı çarpanı: Hız çarpanı, modelin orijinal öğrenme hızını değiştirir. 1 değerinde, modelin orijinal öğrenme hızı kullanılır. 1'den büyük değerler öğrenme hızını artırır, 1 ile 0 arasında olan değerler ise öğrenme hızını düşürür.
Önerilen yapılandırmalar
Aşağıdaki tabloda bir temel modeli:
Hiperparametre | Varsayılan değer | Önerilen ayarlamalar |
---|---|---|
Dönem | 5 |
Kayıp 5 dönemden önce sabitlenmeye başlarsa daha küçük bir değer kullanın. Kayıp yakınlaşıyorsa ve durağanlaşmıyorsa daha yüksek bir değer kullanın. |
Grup boyutu | 4 | |
Öğrenme hızı | 0,001 | Daha küçük veri kümeleri için daha küçük bir değer kullanın. |
Kayıp eğrisi, modelin tahmininin ideal değerden ne kadar saptığını gösterir.
tahminlerle ilgili daha fazla bilgi edinebilirsiniz. İdeal olarak, eğrinin düzleşmeden hemen önceki en düşük noktasında eğitimi durdurmak istersiniz. Örneğin, aşağıdaki grafikte kayıp eğrisinin yaklaşık 4-6. dönemde sabit bir seviyeye ulaştığı gösterilmektedir. Bu, Epoch
parametresini 4'e ayarlasanız bile aynı performansı elde edebileceğiniz anlamına gelir.
Ayarlama işinin durumunu kontrol etme
Ayarlama işinizin durumunu Google AI Studio'daki Kitaplığım sekmesinde veya Gemini API'de ayarlanmış modelin metadata
mülkünü kullanarak kontrol edebilirsiniz.
Hataları giderme
Bu bölümde, ayarlanmış modelinizi oluştururken karşılaşabileceğiniz hataları nasıl gidereceğinizle ilgili ipuçları verilmiştir.
Kimlik doğrulama
API ve istemci kitaplığını kullanarak ayarlama yapmak için kimlik doğrulaması gerekir. Kimlik doğrulamasını API anahtarı (önerilen) veya OAuth kimlik bilgileri kullanarak ayarlayabilirsiniz. API anahtarı ayarlamayla ilgili belgeler için bkz. API anahtarı ayarlama.
'PermissionDenied: 403 Request had insufficient authentication
scopes'
hatası görürseniz OAuth kullanarak kullanıcı kimlik doğrulamasını ayarlamanız gerekebilir.
kimlik bilgileri. Python için OAuth kimlik bilgilerini yapılandırmak üzere OAuth kurulum eğitimimizi ziyaret edin.
İptal edilen modeller
İnce ayar işini, iş tamamlanmadan önce istediğiniz zaman iptal edebilirsiniz. Ancak, iptal edilen bir modelin çıkarım performansı tahmin edilemez. Özellikle ayarlama işi eğitimin başlarında iptal edilirse. Üyeliğinizi eğitimi daha erken bir dönemde durdurmak isterseniz, daha düşük bir değere ayarlayabilirsiniz.
Ayarlanmış modellerle ilgili sınırlamalar
Not: Ayarlanmış modellerde aşağıdaki sınırlamalar geçerlidir:
- Ayarlanmış Gemini 1.5 Flash modelinin giriş sınırı 40.000 karakterdir.
- JSON modu, ayarlanmış modellerde desteklenmez.
- Yalnızca metin girişi desteklenir.
Sırada ne var?
İnce ayar eğiticileriyle başlayın: