Az sayıda istem sunma gibi istem tasarımı stratejileri her zaman ihtiyacınız olan sonuçları vermeyebilir. İnce ayarlama, modelinizin belirli görevlerdeki performansını artırabilecek veya talimatlar yeterli olmadığında ve istediğiniz çıktıları gösteren bir örnek grubunuz olduğunda modelin belirli çıkış koşullarına uymasına yardımcı olabilecek bir işlemdir.
Bu sayfada, Gemini API metin hizmetinin arkasındaki metin modelinde ince ayar yapma işlemine kavramsal bir genel bakış sunulmaktadır. Ayarlamaya başlamaya hazır olduğunuzda ince ayar eğitimi'ni deneyin. LLM'leri belirli kullanım alanları için özelleştirmeyle ilgili daha genel bir girişe göz atmak istiyorsanız Makine Öğrenimi Hızlandırılmış Kursu'ndaki LLM'ler: İnce ayar, damıtma ve istem mühendisliği bölümüne göz atın.
İnce ayarların işleyiş şekli
İnce ayarlama işleminin amacı, modelin performansını belirli göreviniz için daha da iyileştirmektir. İnce ayar, modele göreve ait birçok örnek içeren bir eğitim veri kümesi sağlayarak çalışır. Niş görevler için, modeli az sayıda örnekle ayarlayarak model performansında önemli iyileştirmeler elde edebilirsiniz. Bu tür model ayarlama işlemi, diğer hassas ayar türlerinden ayırt etmek için bazen gözetimli hassas ayarlama olarak adlandırılır.
Eğitim verileriniz, istem girişleri ve beklenen yanıt çıkışları içeren örnekler olarak yapılandırılmalıdır. Modelleri doğrudan Google AI Studio'da örnek verileri kullanarak da ayarlayabilirsiniz. Amaç, modele bu davranışı veya görevi gösteren birçok örnek vererek istenen davranışı ya da görevi taklit etmeyi öğretmektir.
Bir ayarlama işi çalıştırdığınızda model, istenen görevi gerçekleştirmek veya istenen davranışı öğrenmek için gerekli bilgileri kodlamasına yardımcı olan ek parametreler öğrenir. Bu parametreler daha sonra çıkarım sırasında kullanılabilir. Ayarlama işinin çıktısı, yeni öğrenilen parametrelerin ve orijinal modelin bir kombinasyonu olan yeni bir modeldir.
Veri kümenizi hazırlama
İnce ayar yapmaya başlamadan önce modeli ayarlamak için bir veri kümesine ihtiyacınız vardır. En iyi performans için veri kümesindeki örnekler yüksek kaliteli, çeşitli ve gerçek girişleri ve çıkışları temsil etmelidir.
Biçim
Veri kümenize dahil edilen örnekler, beklenen üretim trafiğinizle eşleşmelidir. Veri kümeniz belirli bir biçimlendirme, anahtar kelime, talimat veya bilgi içeriyorsa üretim verileri de aynı şekilde biçimlendirilmeli ve aynı talimatları içermelidir.
Örneğin, veri kümenizdeki örneklerde bir "question:"
ve bir "context:"
varsa üretim trafiği de veri kümesi örneklerinde göründüğü sırayla bir "question:"
ve bir "context:"
içerecek şekilde biçimlendirilmelidir. Bağlamı hariç tutarsanız model, tam soru veri kümesindeki bir örnekte yer alsa bile kalıbı tanıyamaz.
Başka bir örnek olarak, bir sıradaki sonraki sayıyı oluşturan bir uygulama için Python eğitim verilerini burada bulabilirsiniz:
training_data = [
{"text_input": "1", "output": "2"},
{"text_input": "3", "output": "4"},
{"text_input": "-3", "output": "-2"},
{"text_input": "twenty two", "output": "twenty three"},
{"text_input": "two hundred", "output": "two hundred one"},
{"text_input": "ninety nine", "output": "one hundred"},
{"text_input": "8", "output": "9"},
{"text_input": "-98", "output": "-97"},
{"text_input": "1,000", "output": "1,001"},
{"text_input": "10,100,000", "output": "10,100,001"},
{"text_input": "thirteen", "output": "fourteen"},
{"text_input": "eighty", "output": "eighty one"},
{"text_input": "one", "output": "two"},
{"text_input": "three", "output": "four"},
{"text_input": "seven", "output": "eight"},
]
Veri kümenizdeki her bir örneğe bir istem veya önsöz eklemek de ayarlanmış modelin performansını artırmanıza yardımcı olabilir. Veri kümenize bir istem veya önsöz eklenirse bu istem veya önsözün, çıkarım sırasında ayarlanmış modele gönderilen istemlere de dahil edilmesi gerektiğini unutmayın.
Sınırlamalar
Not: Gemini 1.5 Flash için veri kümelerinde hassas ayar yapmanın aşağıdaki sınırlamaları vardır:
- Örnek başına maksimum giriş boyutu 40.000 karakterdir.
- Örnek başına maksimum çıkış boyutu 5.000 karakterdir.
Eğitim verisi boyutu
Bir modelde en az 20 örnekle hassas ayar yapabilirsiniz. Ek veriler genellikle yanıtların kalitesini artırır. Uygulamanıza bağlı olarak 100 ila 500 örnek hedeflemeniz gerekir. Aşağıdaki tabloda, çeşitli yaygın görevler için bir metin modelinde ince ayar yapmak üzere önerilen veri kümesi boyutları gösterilmektedir:
Görev | Veri kümesindeki örnek sayısı |
---|---|
Sınıflandırma | 100+ |
Özetleme | 100-500+ |
Doküman arama | 100+ |
Tuning veri kümenizi yükleme
Veriler, API kullanılarak veya Google AI Studio'ya yüklenen dosyalar aracılığıyla satır içi olarak iletilir.
İstemci kitaplığını kullanmak için createTunedModel
çağrısında veri dosyasını sağlayın.
Dosya boyutu sınırı 4 MB'tır. Başlamak için Python ile hassas ayar hızlı başlangıç kılavuzuna göz atın.
cURL'ı kullanarak REST API'yi çağırmak için training_data
bağımsız değişkenine JSON biçiminde eğitim örnekleri sağlayın. Başlamak için cURL ile ayarlama hızlı başlangıç kılavuzuna göz atın.
Gelişmiş ayar ayarları
Ayarlama işi oluştururken aşağıdaki gelişmiş ayarları belirtebilirsiniz:
- Dönemler: Her bir örneğin bir kez işlendiği şekilde eğitim veri kümesinin tamamında tam bir eğitim geçişi.
- Grup boyutu: Bir eğitim iterasyonunda kullanılan örnek grubu. Grup boyutu, bir gruptaki örnek sayısını belirler.
- Öğrenme hızı: Algoritmaya her iterasyonda model parametrelerini ne kadar güçlü ayarlayacağını söyleyen kayan noktalı bir sayı. Örneğin, 0,3'lük bir öğrenme hızı, ağırlıkları ve önyargıları 0,1'lik bir öğrenme hızından üç kat daha güçlü bir şekilde ayarlar. Yüksek ve düşük öğrenme oranlarının kendine özgü avantajları ve dezavantajları vardır ve kullanım alanınıza göre ayarlanmalıdır.
- Öğrenme hızı çarpanı: Hız çarpanı, modelin orijinal öğrenme hızını değiştirir. 1 değerinde, modelin orijinal öğrenme hızı kullanılır. 1'den büyük değerler öğrenme hızını artırır, 1 ile 0 arasında olan değerler ise öğrenme hızını düşürür.
Önerilen yapılandırmalar
Aşağıdaki tabloda, temel modelde ince ayar yapmak için önerilen yapılandırmalar gösterilmektedir:
Hiperparametre | Varsayılan değer | Önerilen ayarlamalar |
---|---|---|
Epoch | 5 |
Kayıp 5 dönemden önce sabitlenmeye başlarsa daha küçük bir değer kullanın. Kayıp yakınsamaya doğru gidiyorsa ve sabitlenmemişse daha yüksek bir değer kullanın. |
Grup boyutu | 4 | |
Öğrenme hızı | 0,001 | Daha küçük veri kümeleri için daha küçük bir değer kullanın. |
Kayıp eğrisi, her dönemden sonra modelin tahmininin eğitim örneklerindeki ideal tahminlerden ne kadar saptığını gösterir. İdeal olarak, düz bir çizgiye ulaşmadan hemen önce eğrinin en düşük noktasında eğitimi durdurmak istersiniz. Örneğin, aşağıdaki grafikte kayıp eğrisinin yaklaşık 4-6. dönemde sabit bir seviyeye ulaştığı gösterilmektedir. Bu, Epoch
parametresini 4'e ayarlasanız bile aynı performansı elde edebileceğiniz anlamına gelir.
Ayarlama işinin durumunu kontrol etme
Ayarlama işinizin durumunu Google AI Studio'daki Kitaplığım sekmesinde veya Gemini API'de ayarlanmış modelin metadata
mülkünü kullanarak kontrol edebilirsiniz.
Hataları giderme
Bu bölümde, ayarlanmış modelinizi oluştururken karşılaşabileceğiniz hataları nasıl çözeceğinizle ilgili ipuçları verilmiştir.
Kimlik doğrulama
API ve istemci kitaplığını kullanarak ayarlama yapmak için kimlik doğrulaması gerekir. Kimlik doğrulamayı API anahtarı (önerilen) veya OAuth kimlik bilgileri kullanarak ayarlayabilirsiniz. API anahtarı oluşturma hakkında dokümanlar için API anahtarı oluşturma başlıklı makaleyi inceleyin.
'PermissionDenied: 403 Request had insufficient authentication
scopes'
hatası görürseniz OAuth kimlik bilgilerini kullanarak kullanıcı kimlik doğrulamasını ayarlamanız gerekebilir. Python için OAuth kimlik bilgilerini yapılandırmak üzere OAuth kurulum eğitimimizi ziyaret edin.
İptal edilen modeller
İnce ayar işini, iş tamamlanmadan önce istediğiniz zaman iptal edebilirsiniz. Ancak, iptal edilen bir modelin çıkarım performansı tahmin edilemez. Özellikle ayarlama işi eğitimin başlarında iptal edilirse. Eğitimi daha önceki bir epoch'ta durdurmak istediğiniz için iptal ettiyseniz yeni bir ayarlama işi oluşturmanız ve epoch'u daha düşük bir değere ayarlamanız gerekir.
Ayarlanmış modellerin sınırlamaları
Not: Ayarlanmış modellerde aşağıdaki sınırlamalar vardır:
- Ayarlanmış bir Gemini 1.5 Flash modelinin giriş sınırı 40.000 karakterdir.
- JSON modu, ayarlanmış modellerde desteklenmez.
- Sistem talimatı, ayarlanmış modellerde desteklenmez.
- Yalnızca metin girişi desteklenir.
Sırada ne var?
İnce ayar eğitimlerini inceleyerek başlayın: