Hướng dẫn tinh chỉnh

Hướng dẫn này sẽ giúp bạn bắt đầu sử dụng dịch vụ điều chỉnh API Gemini bằng SDK Python hoặc API REST thông qua curl. Các ví dụ này cho thấy cách điều chỉnh mô hình văn bản đằng sau dịch vụ tạo văn bản của Gemini API.

Trước khi bắt đầu

Trước khi gọi Gemini API, hãy đảm bảo bạn đã cài đặt SDK mà bạn chọn và khoá Gemini API đã được định cấu hình và sẵn sàng sử dụng.

Xem trên ai.google.dev

Dùng thử sổ tay Colab

Xem sổ tay trên GitHub

Các điểm hạn chế

Trước khi điều chỉnh mô hình, bạn nên lưu ý những hạn chế sau:

Tinh chỉnh tập dữ liệu

Việc tinh chỉnh tập dữ liệu cho Gemini 1.5 Flash có các giới hạn sau:

Kích thước đầu vào tối đa cho mỗi ví dụ là 40.000 ký tự.
Kích thước đầu ra tối đa cho mỗi ví dụ là 5.000 ký tự.
Chỉ hỗ trợ các ví dụ về cặp đầu vào-đầu ra. Không hỗ trợ các cuộc trò chuyện nhiều lượt trò chuyện theo kiểu trò chuyện.

Mô hình được điều chỉnh

Mô hình được điều chỉnh có các hạn chế sau:

Giới hạn đầu vào của mô hình Gemini 1.5 Flash đã điều chỉnh là 40.000 ký tự.
Chế độ JSON không được hỗ trợ với các mô hình đã điều chỉnh.
Chỉ hỗ trợ phương thức nhập văn bản.

Liệt kê các mô hình đã điều chỉnh

Bạn có thể kiểm tra các mô hình đã điều chỉnh hiện có bằng phương thức tunedModels.list.

from google import genai
from google.genai import types
client = genai.Client() # Get the key from the GOOGLE_API_KEY env variable

for model_info in client.models.list():
    print(model_info.name)

Tạo mô hình đã điều chỉnh

Để tạo một mô hình được điều chỉnh, bạn cần truyền dataset của mình vào mô hình trong phương thức tunedModels.create.

Trong ví dụ này, bạn sẽ điều chỉnh một mô hình để tạo số tiếp theo trong trình tự. Ví dụ: nếu dữ liệu đầu vào là 1, thì mô hình sẽ xuất ra 2. Nếu giá trị đầu vào là one hundred, thì kết quả sẽ là one hundred one.

# create tuning model
training_dataset =  [
    ["1", "2"],
    ["3", "4"],
    ["-3", "-2"],
    ["twenty two", "twenty three"],
    ["two hundred", "two hundred one"],
    ["ninety nine", "one hundred"],
    ["8", "9"],
    ["-98", "-97"],
    ["1,000", "1,001"],
    ["10,100,000", "10,100,001"],
    ["thirteen", "fourteen"],
    ["eighty", "eighty one"],
    ["one", "two"],
    ["three", "four"],
    ["seven", "eight"],
]
training_dataset=types.TuningDataset(
        examples=[
            types.TuningExample(
                text_input=i,
                output=o,
            )
            for i,o in training_dataset
        ],
    )
tuning_job = client.tunings.tune(
    base_model='models/gemini-1.5-flash-001-tuning',
    training_dataset=training_dataset,
    config=types.CreateTuningJobConfig(
        epoch_count= 5,
        batch_size=4,
        learning_rate=0.001,
        tuned_model_display_name="test tuned model"
    )
)

# generate content with the tuned model
response = client.models.generate_content(
    model=tuning_job.tuned_model.model,
    contents='III',
)

print(response.text)

Giá trị tối ưu cho số lượng epoch, kích thước lô và tốc độ học phụ thuộc vào tập dữ liệu và các quy tắc ràng buộc khác của trường hợp sử dụng. Để tìm hiểu thêm về các giá trị này, hãy xem phần Cài đặt tinh chỉnh nâng cao và Thông số siêu dữ liệu.

Thử mô hình

Bạn có thể sử dụng phương thức tunedModels.generateContent và chỉ định tên của mô hình đã điều chỉnh để kiểm tra hiệu suất của mô hình đó.

response = client.models.generate_content(
    model=tuning_job.tuned_model.model,
    contents='III'
)

Chưa triển khai

Một số tính năng (báo cáo tiến trình, cập nhật nội dung mô tả và xoá mô hình đã điều chỉnh) chưa được triển khai trong SDK mới.