Pengantar penyesuaian model

Strategi desain prompt seperti beberapa shot prompting mungkin tidak selalu memberikan hasil yang Anda butuhkan. Gunakan penyesuaian model untuk meningkatkan performa model pada tugas tertentu atau membantu model mematuhi persyaratan output tertentu jika petunjuk tidak memadai, dan Anda memiliki serangkaian contoh yang menunjukkan output yang Anda inginkan.

Halaman ini memberikan panduan tentang cara menyesuaikan model teks di belakang layanan teks Gemini API.

Cara kerja penyesuaian model

Sasaran penyesuaian model adalah untuk lebih meningkatkan performa model untuk tugas spesifik Anda. Penyesuaian model bekerja dengan menyediakan set data pelatihan yang berisi banyak contoh tugas kepada model. Untuk tugas khusus, Anda dapat memperoleh peningkatan performa model yang signifikan dengan menyesuaikan model pada sejumlah kecil contoh.

Data pelatihan Anda harus disusun sebagai contoh dengan input perintah dan output respons yang diharapkan. Anda juga dapat menyesuaikan model menggunakan data contoh langsung di Google AI Studio. Tujuannya adalah untuk mengajari model agar meniru perilaku atau tugas yang diinginkan, dengan memberinya banyak contoh yang menggambarkan perilaku atau tugas tersebut.

Saat Anda menjalankan tugas tuning, model akan mempelajari parameter tambahan yang membantunya mengenkode informasi yang diperlukan untuk melakukan tugas yang diinginkan atau mempelajari perilaku yang diinginkan. Parameter ini kemudian dapat digunakan pada waktu inferensi. Output dari tugas tuning adalah model baru, yang pada dasarnya merupakan kombinasi dari parameter yang baru dipelajari, dan model asli.

Model yang didukung

Model dasar berikut mendukung penyesuaian model. Hanya penyelesaian teks satu giliran yang didukung.

  • Gemini 1.0 Pro
  • text-bison-001

Alur kerja untuk penyesuaian model

Alur kerja penyesuaian model adalah sebagai berikut:

  1. Siapkan set data Anda.
  2. Impor set data jika Anda menggunakan Google AI Studio.
  3. Memulai tugas tuning.

Setelah penyesuaian model selesai, nama model yang telah Anda sesuaikan akan ditampilkan. Anda juga dapat memilihnya di Google AI Studio sebagai model yang akan digunakan saat membuat perintah baru.

Menyiapkan set data

Sebelum dapat memulai tuning, Anda memerlukan set data untuk men-tuning model. Untuk performa terbaik, contoh dalam set data harus berkualitas tinggi, beragam, serta mewakili input dan output nyata.

Format

Contoh yang disertakan dalam set data Anda harus cocok dengan traffic produksi yang diharapkan. Jika set data Anda berisi pemformatan, kata kunci, petunjuk, atau informasi tertentu, data produksi harus diformat dengan cara yang sama dan berisi petunjuk yang sama.

Misalnya, jika contoh di set data Anda menyertakan "question:" dan "context:", traffic produksi juga harus diformat untuk menyertakan "question:" dan "context:" dalam urutan yang sama seperti yang tampak pada contoh set data. Jika Anda mengecualikan konteksnya, model tidak dapat mengenali polanya, meskipun pertanyaan yang tepatnya ada dalam contoh di set data.

Menambahkan perintah atau preamble ke setiap contoh dalam set data Anda juga dapat membantu meningkatkan performa model yang disesuaikan. Perlu diperhatikan, jika prompt atau preamble disertakan dalam set data Anda, prompt atau preamble juga harus disertakan dalam prompt ke model yang disesuaikan pada waktu inferensi.

Ukuran data pelatihan

Anda dapat menyesuaikan model dengan minimal 20 contoh, dan data tambahan umumnya akan meningkatkan kualitas respons. Anda harus menargetkan antara 100 hingga 500 contoh, bergantung pada aplikasi Anda. Tabel berikut menunjukkan ukuran set data yang direkomendasikan untuk menyesuaikan model teks dengan berbagai tugas umum:

Tugas Jumlah contoh dalam set data
Classification 100+
Perangkuman 100-500+
Penelusuran dokumen 100+

Mengupload set data penyesuaian

Data diteruskan secara inline menggunakan API atau melalui file yang diupload di Google AI Studio.

Gunakan tombol Import untuk mengimpor data dari file atau pilih dialog terstruktur dengan contoh untuk diimpor sebagai set data penyesuaian Anda.

Library klien

Untuk menggunakan library klien, sediakan file data dalam panggilan createTunedModel. Batas ukuran file adalah 4 MB. Lihat panduan memulai menyesuaikan dengan Python untuk memulai.

Curl

Untuk memanggil REST API menggunakan Curl, berikan contoh pelatihan dalam format JSON ke argumen training_data. Lihat panduan memulai penyesuaian dengan Curl untuk memulai.

Setelan penyesuaian lanjutan

Saat membuat tugas tuning, Anda dapat menentukan setelan lanjutan berikut:

  • Epoch - Tiket pelatihan penuh pada seluruh set pelatihan sehingga setiap contoh telah diproses satu kali.
  • Ukuran batch - Kumpulan contoh yang digunakan dalam satu iterasi pelatihan. Ukuran tumpukan menentukan jumlah contoh dalam sebuah batch.
  • Kecepatan pembelajaran - Bilangan floating point yang memberi tahu algoritme seberapa kuat penyesuaian parameter model pada setiap iterasi. Misalnya, kecepatan pembelajaran 0,3 akan menyesuaikan bobot dan bias tiga kali lebih kuat daripada kecepatan pembelajaran 0,1. Kecepatan pembelajaran yang tinggi dan rendah memiliki konsekuensinya sendiri yang unik dan harus disesuaikan berdasarkan kasus penggunaan Anda.
  • Pengganda kecepatan pembelajaran - Pengganda kecepatan mengubah kecepatan pembelajaran asli model. Nilai 1 menggunakan kecepatan pemelajaran asli dari model. Nilai yang lebih besar dari 1 akan meningkatkan kecepatan pemelajaran dan nilai antara 1 dan 0 akan menurunkan kecepatan pemelajaran.

Tabel berikut menampilkan konfigurasi yang direkomendasikan untuk menyesuaikan model dasar:

Hyperparameter Nilai default Penyesuaian yang direkomendasikan
Zaman 5 Jika loss mulai mendatar sebelum 5 epoch, gunakan nilai yang lebih kecil.
Jika kerugian makin menyatu dan tidak tampak stabil, gunakan nilai yang lebih tinggi.
Ukuran batch 4
Kecepatan pembelajaran 0,001 Gunakan nilai yang lebih kecil untuk set data yang lebih kecil.

Kurva kerugian menunjukkan seberapa besar prediksi model yang menyimpang dari prediksi ideal dalam contoh pelatihan setelah setiap epoch. Idealnya, Anda ingin berhenti berlatih pada titik terendah dalam kurva, tepat sebelum dataran tinggi. Misalnya, grafik di bawah ini menunjukkan peningkatan kurva kerugian pada sekitar epoch 4-6, yang berarti Anda dapat menetapkan parameter Epoch ke 4 dan masih mendapatkan performa yang sama.

Kurva penurunan

Memeriksa status tugas tuning

Anda dapat memeriksa status tugas tuning di UI Google AI Studio pada tab My Library atau menggunakan properti metadata dari model yang telah di-tuning di Gemini API.

Memecahkan masalah error

Bagian ini berisi tips tentang cara mengatasi error yang mungkin Anda alami saat membuat model yang telah disesuaikan.

Autentikasi

Penyesuaian menggunakan API dan library klien memerlukan autentikasi pengguna. Kunci API saja tidak cukup. Jika melihat error 'PermissionDenied: 403 Request had insufficient authentication scopes', Anda harus menyiapkan autentikasi pengguna.

Guna mengonfigurasi kredensial OAuth untuk Python, lihat tutorial penyiapan OAuth.

Model yang dibatalkan

Anda dapat membatalkan tugas penyesuaian model kapan saja sebelum tugas selesai. Namun, performa inferensi dari model yang dibatalkan tidak dapat diprediksi, terutama jika tugas tuning dibatalkan di awal pelatihan. Jika Anda membatalkan karena ingin menghentikan pelatihan pada epoch sebelumnya, Anda harus membuat tugas tuning baru dan menetapkan epoch ke nilai yang lebih rendah.

Langkah selanjutnya