現已推出 Gemini 1.5 Pro 200 萬個脈絡窗口、程式碼執行功能和 Gemma 2。瞭解詳情

本頁面由 Cloud Translation API 翻譯而成。

微調教學課程

前往 ai.google.dev 查看

在 Google Colab 中執行

前往 GitHub 查看原始碼

在本筆記本中，您將瞭解如何透過 Gemini API 適用的 Python 用戶端程式庫開始使用調整服務。本課程將說明如何調整 Gemini API 文字生成服務中的文字模型

事前準備：設定專案和 API 金鑰

呼叫 Gemini API 之前，您必須設定專案並設定 API 金鑰。

展開即可瞭解如何設定專案和 API 金鑰

取得並保護 API 金鑰

須有 API 金鑰才能呼叫 Gemini API。如果您沒有金鑰請在 Google AI Studio 中建立金鑰

取得 API 金鑰

強烈建議您「不要」在版本管控系統中登錄 API 金鑰。請改為將 API 金鑰儲存在密鑰存放區 (例如 Secret Manager)。

安裝 SDK 套件並設定 API 金鑰

Gemini API 適用的 Python SDK 包含在 google-generativeai 套件中。

使用 pip 安裝依附元件：
```
pip install -U google-generativeai
```

匯入套件並使用 API 金鑰設定服務：

import os
import google.generativeai as genai

genai.configure(api_key=os.environ['API_KEY'])

設定

設定驗證方法

Gemini API 可讓您根據自己的資料調整模型。由於您是您的資料和調整過的模型，因此需要比 API 金鑰可提供更嚴格的存取權控管。

在執行本教學課程之前，您必須先為專案設定 OAuth。

如要在 Colab 中設定，最簡單的方法是將 client_secret.json 檔案的內容複製到 Colab 的「Secret Manager」(位於左側面板中的金鑰圖示下方)，名稱為 CLIENT_SECRET。

這個 gcloud 指令會將 client_secret.json 檔案轉換成可用於驗證服務的憑證。

重要事項： 如果您在 Colab 中執行此步驟，請不要直接按一下列印顯示的連結，否則會失敗。請按照操作說明，將輸出的 gcloud 指令複製到本機電腦並執行，然後將本機電腦的輸出內容貼回這裡。

import os
if 'COLAB_RELEASE_TAG' in os.environ:
  from google.colab import userdata
  import pathlib
  pathlib.Path('client_secret.json').write_text(userdata.get('CLIENT_SECRET'))

  # Use `--no-browser` in colab
  !gcloud auth application-default login --no-browser --client-id-file client_secret.json --scopes='https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/generative-language.tuning'
else:
  !gcloud auth application-default login --client-id-file client_secret.json --scopes='https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/generative-language.tuning'

安裝用戶端程式庫

pip install -q google-generativeai

匯入程式庫

import google.generativeai as genai

您可以使用 genai.list_tuned_model 方法，查看經過調整的現有模型。

for i, m in zip(range(5), genai.list_tuned_models()):
  print(m.name)

tunedModels/my-model-8527
tunedModels/my-model-7092
tunedModels/my-model-2778
tunedModels/my-model-1298
tunedModels/my-model-3883

建立經過調整的模型

如要建立調整後的模型，您需要透過 genai.create_tuned_model 方法將資料集傳送至模型。方法很簡單，只要在呼叫中直接定義輸入和輸出值，或從檔案匯入至 DataFrame，並傳遞至方法即可。

在本範例中，您將調整模型，以依序產生下一個數字。舉例來說，如果輸入內容是 1，則模型應輸出 2。如果輸入內容是 one hundred，則輸出內容應為 one hundred one。

base_model = [
    m for m in genai.list_models()
    if "createTunedModel" in m.supported_generation_methods][0]
base_model

Model(name='models/gemini-1.0-pro-001',
      base_model_id='',
      version='001',
      display_name='Gemini 1.0 Pro',
      description=('The best model for scaling across a wide range of tasks. This is a stable '
                   'model that supports tuning.'),
      input_token_limit=30720,
      output_token_limit=2048,
      supported_generation_methods=['generateContent', 'countTokens', 'createTunedModel'],
      temperature=0.9,
      top_p=1.0,
      top_k=1)

import random

name = f'generate-num-{random.randint(0,10000)}'
operation = genai.create_tuned_model(
    # You can use a tuned model here too. Set `source_model="tunedModels/..."`
    source_model=base_model.name,
    training_data=[
        {
             'text_input': '1',
             'output': '2',
        },{
             'text_input': '3',
             'output': '4',
        },{
             'text_input': '-3',
             'output': '-2',
        },{
             'text_input': 'twenty two',
             'output': 'twenty three',
        },{
             'text_input': 'two hundred',
             'output': 'two hundred one',
        },{
             'text_input': 'ninety nine',
             'output': 'one hundred',
        },{
             'text_input': '8',
             'output': '9',
        },{
             'text_input': '-98',
             'output': '-97',
        },{
             'text_input': '1,000',
             'output': '1,001',
        },{
             'text_input': '10,100,000',
             'output': '10,100,001',
        },{
             'text_input': 'thirteen',
             'output': 'fourteen',
        },{
             'text_input': 'eighty',
             'output': 'eighty one',
        },{
             'text_input': 'one',
             'output': 'two',
        },{
             'text_input': 'three',
             'output': 'four',
        },{
             'text_input': 'seven',
             'output': 'eight',
        }
    ],
    id = name,
    epoch_count = 100,
    batch_size=4,
    learning_rate=0.001,
)

調整後的模型會立即新增至調整後的模型清單，但在模型調整期間，狀態會設定為「建立」。

model = genai.get_tuned_model(f'tunedModels/{name}')

model

TunedModel(name='tunedModels/generate-num-2946',
           source_model='models/gemini-1.0-pro-001',
           base_model='models/gemini-1.0-pro-001',
           display_name='',
           description='',
           temperature=0.9,
           top_p=1.0,
           top_k=1,
           state=<State.CREATING: 1>,
           create_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 448050, tzinfo=datetime.timezone.utc),
           update_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 448050, tzinfo=datetime.timezone.utc),
           tuning_task=TuningTask(start_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 890698, tzinfo=datetime.timezone.utc),
                                  complete_time=None,
                                  snapshots=[],
                                  hyperparameters=Hyperparameters(epoch_count=100,
                                                                  batch_size=4,
                                                                  learning_rate=0.001)))

model.state

<State.CREATING: 1>

查看調整進度

使用 metadata 檢查狀態：

operation.metadata

total_steps: 375
tuned_model: "tunedModels/generate-num-2946"

等待訓練完成使用 operation.result() 或 operation.wait_bar()

import time

for status in operation.wait_bar():
  time.sleep(30)

0%|          | 0/375 [00:00<?, ?it/s]

您隨時可以使用 cancel() 方法取消調整工作。取消註解以下這行程式碼，然後執行程式碼儲存格，在工作完成前取消工作。

# operation.cancel()

調整完成後，您可以透過調整結果查看損失曲線。損失曲線會顯示模型預測結果與理想輸出內容之間的差距。

import pandas as pd
import seaborn as sns

model = operation.result()

snapshots = pd.DataFrame(model.tuning_task.snapshots)

sns.lineplot(data=snapshots, x = 'epoch', y='mean_loss')

<Axes: xlabel='epoch', ylabel='mean_loss'>

png

評估模型

您可以使用 genai.generate_text 方法，並指定模型名稱來測試模型效能。

model = genai.GenerativeModel(model_name=f'tunedModels/{name}')

result = model.generate_content('55')
result.text

'56'

result = model.generate_content('123455')
result.text

'123456'

result = model.generate_content('four')
result.text

'five'

result = model.generate_content('quatre') # French 4
result.text                               # French 5 is "cinq"

'cinq'

result = model.generate_content('III')    # Roman numeral 3
result.text                               # Roman numeral 4 is IV

'IV'

result = model.generate_content('七')  # Japanese 7
result.text                            # Japanese 8 is 八!

'八'

儘管我們似乎已開始進行工作，儘管範例不多，但「下一個」的概念比較簡單，請參閱調整指南，進一步瞭解如何改善效能。

更新說明

您隨時可以使用 genai.update_tuned_model 方法更新調整後模型的說明。

genai.update_tuned_model(f'tunedModels/{name}', {"description":"This is my model."});

model = genai.get_tuned_model(f'tunedModels/{name}')

model.description

'This is my model.'

刪除模型

您可以刪除不再需要的模型，清理調整後的模型清單。使用 genai.delete_tuned_model 方法刪除模型。如果您已取消任何調整工作，則可能需要刪除這些工作，因為其效能可能無法預測。

genai.delete_tuned_model(f'tunedModels/{name}')

模型已不存在：

try:
  m = genai.get_tuned_model(f'tunedModels/{name}')
  print(m)
except Exception as e:
  print(f"{type(e)}: {e}")

<class 'google.api_core.exceptions.NotFound'>: 404 Tuned model tunedModels/generate-num-2946 does not exist.