查看全新 Gemini API 实战宝典和我们的社区论坛。

此页面由 Cloud Translation API 翻译。

Gemini API：使用 Python 调整模型

在 ai.google.dev 上查看

在 Google Colab 中运行

查看 GitHub 上的源代码

在此笔记本中，您将学习如何使用 Gemini API 的 Python 客户端库开始使用调整服务。在这里，您将学习如何调整 Gemini API 文本生成服务背后的文本模型。

初始设置

身份验证

借助 Gemini API，您可以使用自己的数据调整模型。由于这是您的数据和您调整后的模型，因此需要比 API 密钥提供的更严格的访问权限控制。

您需要先为项目设置 OAuth，然后才能运行本教程。

在 Colab 中，最简单的设置方法是将 client_secret.json 文件的内容复制到 Colab 的“Secret Manager”（位于左侧面板中的钥匙图标下方）并命名为 CLIENT_SECRET。

此 gcloud 命令会将 client_secret.json 文件转换为可用于向服务进行身份验证的凭据。

重要提示 ：如果您是在 Colab 中运行此代码，请勿直接点击它输出的链接。这样就会失败。按照说明操作，将它输出的 gcloud 命令复制到您的本地机器上并运行，然后将本地机器的输出粘贴回此处。

import os
if 'COLAB_RELEASE_TAG' in os.environ:
  from google.colab import userdata
  import pathlib
  pathlib.Path('client_secret.json').write_text(userdata.get('CLIENT_SECRET'))

  # Use `--no-browser` in colab
  !gcloud auth application-default login --no-browser --client-id-file client_secret.json --scopes='https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/generative-language.tuning'
else:
  !gcloud auth application-default login --client-id-file client_secret.json --scopes='https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/generative-language.tuning'

安装客户端库

pip install -q google-generativeai

导入库

import google.generativeai as genai

您可以使用 genai.list_tuned_model 方法检查现有的经调整的模型。

for i, m in zip(range(5), genai.list_tuned_models()):
  print(m.name)

tunedModels/my-model-8527
tunedModels/my-model-7092
tunedModels/my-model-2778
tunedModels/my-model-1298
tunedModels/my-model-3883

创建经调整的模型

如需创建经调整的模型，您需要在 genai.create_tuned_model 方法中将数据集传递给模型。为此，您可以直接在调用中定义输入和输出值，或者从文件导入到 DataFrame，以传递给该方法。

在本示例中，您将调整模型以生成序列中的下一个数字。例如，如果输入为 1，模型应输出 2。如果输入为 one hundred，则输出应为 one hundred one。

base_model = [
    m for m in genai.list_models()
    if "createTunedModel" in m.supported_generation_methods][0]
base_model

Model(name='models/gemini-1.0-pro-001',
      base_model_id='',
      version='001',
      display_name='Gemini 1.0 Pro',
      description=('The best model for scaling across a wide range of tasks. This is a stable '
                   'model that supports tuning.'),
      input_token_limit=30720,
      output_token_limit=2048,
      supported_generation_methods=['generateContent', 'countTokens', 'createTunedModel'],
      temperature=0.9,
      top_p=1.0,
      top_k=1)

import random

name = f'generate-num-{random.randint(0,10000)}'
operation = genai.create_tuned_model(
    # You can use a tuned model here too. Set `source_model="tunedModels/..."`
    source_model=base_model.name,
    training_data=[
        {
             'text_input': '1',
             'output': '2',
        },{
             'text_input': '3',
             'output': '4',
        },{
             'text_input': '-3',
             'output': '-2',
        },{
             'text_input': 'twenty two',
             'output': 'twenty three',
        },{
             'text_input': 'two hundred',
             'output': 'two hundred one',
        },{
             'text_input': 'ninety nine',
             'output': 'one hundred',
        },{
             'text_input': '8',
             'output': '9',
        },{
             'text_input': '-98',
             'output': '-97',
        },{
             'text_input': '1,000',
             'output': '1,001',
        },{
             'text_input': '10,100,000',
             'output': '10,100,001',
        },{
             'text_input': 'thirteen',
             'output': 'fourteen',
        },{
             'text_input': 'eighty',
             'output': 'eighty one',
        },{
             'text_input': 'one',
             'output': 'two',
        },{
             'text_input': 'three',
             'output': 'four',
        },{
             'text_input': 'seven',
             'output': 'eight',
        }
    ],
    id = name,
    epoch_count = 100,
    batch_size=4,
    learning_rate=0.001,
)

调整后的模型会立即添加到经调整的模型列表中，但当模型已调整时，其状态将设置为“正在创建”。

model = genai.get_tuned_model(f'tunedModels/{name}')

model

TunedModel(name='tunedModels/generate-num-2946',
           source_model='models/gemini-1.0-pro-001',
           base_model='models/gemini-1.0-pro-001',
           display_name='',
           description='',
           temperature=0.9,
           top_p=1.0,
           top_k=1,
           state=<State.CREATING: 1>,
           create_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 448050, tzinfo=datetime.timezone.utc),
           update_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 448050, tzinfo=datetime.timezone.utc),
           tuning_task=TuningTask(start_time=datetime.datetime(2024, 2, 21, 20, 4, 16, 890698, tzinfo=datetime.timezone.utc),
                                  complete_time=None,
                                  snapshots=[],
                                  hyperparameters=Hyperparameters(epoch_count=100,
                                                                  batch_size=4,
                                                                  learning_rate=0.001)))

model.state

<State.CREATING: 1>

检查调参进度

使用 metadata 检查状态：

operation.metadata

total_steps: 375
tuned_model: "tunedModels/generate-num-2946"

使用 operation.result() 或 operation.wait_bar() 等待训练完成

import time

for status in operation.wait_bar():
  time.sleep(30)

0%|          | 0/375 [00:00<?, ?it/s]

您可以随时使用 cancel() 方法取消调整作业。取消注释下面一行，并运行代码单元以在作业完成之前取消作业。

# operation.cancel()

调参完成后，您可以查看调参结果中的损失曲线。损失曲线显示模型的预测结果与理想输出的偏差程度。

import pandas as pd
import seaborn as sns

model = operation.result()

snapshots = pd.DataFrame(model.tuning_task.snapshots)

sns.lineplot(data=snapshots, x = 'epoch', y='mean_loss')

<Axes: xlabel='epoch', ylabel='mean_loss'>

png

评估模型

您可以使用 genai.generate_text 方法并指定模型的名称来测试模型性能。

model = genai.GenerativeModel(model_name=f'tunedModels/{name}')

result = model.generate_content('55')
result.text

'56'

result = model.generate_content('123455')
result.text

'123456'

result = model.generate_content('four')
result.text

'five'

result = model.generate_content('quatre') # French 4
result.text                               # French 5 is "cinq"

'cinq'

result = model.generate_content('III')    # Roman numeral 3
result.text                               # Roman numeral 4 is IV

'IV'

result = model.generate_content('七')  # Japanese 7
result.text                            # Japanese 8 is 八!

'八'

尽管示例有限，但它似乎已经启动了任务，但“下一个”是一个简单的概念，请参阅调整指南以获取有关提高性能的更多指导。

更新说明

您可以随时使用 genai.update_tuned_model 方法更新已调参模型的说明。

genai.update_tuned_model(f'tunedModels/{name}', {"description":"This is my model."});

model = genai.get_tuned_model(f'tunedModels/{name}')

model.description

'This is my model.'

删除模型

您可以通过删除不再需要的模型来清理调整后的模型列表。使用 genai.delete_tuned_model 方法删除模型。如果您取消了任何调优作业，则可能需要将其删除，因为其效果可能无法预测。

genai.delete_tuned_model(f'tunedModels/{name}')

模型已不存在：

try:
  m = genai.get_tuned_model(f'tunedModels/{name}')
  print(m)
except Exception as e:
  print(f"{type(e)}: {e}")

<class 'google.api_core.exceptions.NotFound'>: 404 Tuned model tunedModels/generate-num-2946 does not exist.