少样本提示等提示设计策略有时可能无法生成 结果。微调是一个可以提高模型预测准确率的过程, 或帮助模型遵循特定的输出结果 说明不够充分,并且您有一组示例时的要求 所需的输出结果
本页面从概念上简要介绍了如何微调背后的文本模型, Gemini API 文本服务。准备好开始调优后,请查看 微调教程。
微调的工作原理
微调的目标是进一步提高模型的性能, 您的特定任务。通过为模型提供训练 数据集包含该任务的许多示例。对于小众任务 通过适度的调整模型来显著提升模型性能 数量。这种模型调优有时称为 监督式微调,以便将其与其他类型的微调区分开来。
您的训练数据应构建为包含提示输入和 预期响应输出。您还可以直接使用示例数据对模型进行调参 。目标是让模型模仿期望的行为 来说明该行为或任务。
当您运行调参作业时,模型会学习帮助它的其他参数 对必要的信息进行编码,以执行您想要的任务或了解 行为这些参数随后可在推断时使用。此 调优作业是一个新模型,它实际上是新模型 和原始模型之间的差异。
准备数据集
在开始微调之前,您需要一个用于调整模型的数据集。对于 以获得最佳性能,则数据集中的样本应具有较高的质量, 并且代表真实的输入和输出。
格式
数据集中包含的样本应与您的预期生产流量相匹配。如果您的数据集包含特定的格式、关键字、说明或信息,则生产数据应以相同方式设置格式并包含相同的说明。
例如,如果数据集中的样本包含 "question:"
和 "context:"
,则生产流量的格式也应设置为包含 "question:"
和 "context:"
,其顺序与在数据集样本中的显示顺序相同。如果您排除上下文,模型将无法识别该模式,
即使确切的问题出现在数据集内的样本中。
为数据集中的每个样本添加提示或序言也有帮助 来提升经过调参的模型的性能。请注意,如果提示或序言 也应该包含在调优参数提示中, 模型生成。
训练数据大小
只需使用 20 个样本即可微调模型。其他数据 通常可以提高响应的质量。目标为 100 和 500 个样本,具体取决于您的应用。下表显示了 针对各种常见任务微调文本模型的推荐数据集大小:
任务 | 数据集中的示例数量 |
---|---|
分类 | 超过 100 |
摘要 | 100 至 500 人以上 |
文档搜索 | 超过 100 |
上传您的调参数据集
数据可使用 API 以内嵌方式传递,也可通过上传到 Google AI Studio。
如需使用客户端库,请在 createTunedModel
调用中提供数据文件。
文件大小上限为 4 MB。请参阅
Python 微调快速入门
。
要使用 c网址 调用 REST API,请向
training_data
参数。请参阅
使用 c网址 调参快速入门
。
高级调参设置
创建调优作业时,您可以指定以下高级设置:
- 周期:对整个训练集进行一次完整训练,确保每个 已经过一次处理。
- 批次大小:一次训练迭代中使用的样本集。通过 批次大小决定了一个批次中的样本数。
- 学习速率:一个浮点数,用于告知算法如何 调整每次迭代的模型参数。例如, 如果将学习速率设为 0.3,则权重和偏差调整量将增加三倍 这比 0.1 的学习速率要大得多。高学习速率和低学习速率 各有各的利弊,应根据您的用例进行调整。
- 学习速率调节系数:速率调节系数会修改模型的 原始学习速率。值为 1,表示 模型。值大于 1 时,学习速率会提高;值大于 1 0 则降低学习速率。
建议的配置
下表显示了用于微调 基础模型:
超参数 | 默认值 | 建议的调整 |
---|---|---|
Epoch | 5 |
如果损失在 5 个周期之前开始趋于稳定,请使用较小的值。 如果损失收敛且似乎没有趋于稳定,请使用较高的值。 |
批次大小 | 4 | |
学习速率 | 0.001 | 对于较小的数据集,请使用较小的值。 |
损失曲线显示的是模型的预测结果与理想值的偏差
训练样本中的预测。理想情况下
在曲线停滞之前,曲线的最低点进行训练。例如:
下面的图表显示了大约第 4-6 个纪元的损失曲线趋于平稳,
您可以将 Epoch
参数设置为 4,并获得相同的性能。
检查调参作业状态
您可以在 Google AI Studio 的
My Library 标签页或在metadata
Gemini API。
排查错误
本部分包含一些提示,介绍了如何解决您在 创建经过调整的模型。
身份验证
使用 API 和客户端库进行调参需要用户身份验证。API 密钥
是不够的如果您看到 'PermissionDenied: 403 Request had
insufficient authentication scopes'
错误,则需要设置用户
身份验证。
要为 Python 配置 OAuth 凭据,请参阅 OAuth 设置教程。
已取消的模型
在微调作业完成之前,您可以随时取消该作业。不过, 取消模型的推理性能不可预测,尤其是当 调优作业在训练的早期阶段就被取消了。如果您取消了订阅,原因是: 想要在较早的周期停止训练,则应创建新的调优 并将周期设置为较低的值。
后续步骤
- 了解 Responsible AI 最佳做法。
- 开始使用 使用 Python 进行调参快速入门 或 使用 c网址 调参快速入门。