Gemini 是一系列生成式 AI 模型,可让开发者生成内容并解决问题。这些模型经过设计和训练,可将文本和图片都处理为输入。本指南提供了有关每个模型变体的信息,可帮助您确定哪个模型变体最契合您的用例。
下面简要介绍了可用模型及其功能:
模型 | 输入 | 输出 |
---|---|---|
双子座 | ||
|
文字和图片 | 文字 |
|
文字 | 文字 |
|
文字和图片 | 文字 |
嵌入 | ||
|
文字 | 文本嵌入 |
检索 | ||
|
文字 | 文字 |
安全和预期用途
生成式人工智能模型是功能强大的工具,但并非没有限制。其多功能性和适用性有时可能会导致意外输出,例如不准确、有偏见或冒犯性的输出。后期处理和严格的手动评估对于限制此类输出造成伤害的风险至关重要。如需了解更多安全使用建议,请参阅安全指南。
Gemini API 提供的模型可用于各种生成式 AI 和自然语言处理 (NLP) 应用。您只能通过 Gemini API 或 Google AI Studio Web 应用使用这些函数。使用 Gemini API 时还必须遵守生成式 AI 使用限制政策和 Gemini API 服务条款。
模型尺寸
下表显示了可用的尺寸及其相对含义。
模型大小 | 说明 | 服务 |
---|---|---|
Gemini 1.0 Pro | 平衡功能和效率的模型大小。 |
|
模型版本
Gemini 模型提供预览版或稳定版两种版本。在您的代码中,您可以使用以下模型名称格式之一来指定要使用的模型和版本。
最新:指向指定世代和变体的尖端模型。底层模型会定期更新,它可能是预览版。只有探索性测试应用和原型才能使用此别名。
如需指定最新版本,请使用以下格式:
<model>-<generation>-<variation>-latest
。例如gemini-1.0-pro-latest
。最新稳定版:指向针对指定的模型生成和变体发布的最新稳定版。
如需指定最新的稳定版,请使用以下格式:
<model>-<generation>-<variation>
。例如gemini-1.0-pro
。稳定版:指向特定的稳定版模型。稳定的模型不会改变。大多数正式版应用都应使用特定的稳定模型。
如需指定稳定版,请使用以下格式:
<model>-<generation>-<variation>-<version>
。例如gemini-1.0-pro-001
。
对于具有稳定版的模型,请参阅模型变体中相应模型的“模型名称”行。
模型变体
Gemini API 提供针对特定应用场景优化的不同模型。下表介绍了每个表的属性。
变体 | 属性 | 说明 |
---|---|---|
Gemini 1.5 Pro(仅限预览版) | 模型上次更新时间 | 2024 年 4 月 |
模型代码 | models/gemini-1.5-pro-latest |
|
模型功能 |
|
|
支持的生成方法 | generateContent |
|
输入令牌限制 | 1048576 | |
输出词元限制 | 8192 | |
模型安全性 | 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。 | |
速率限制 | 每分钟 2 次查询,每天 1000 次查询 [1] | |
Gemini Pro | 模型上次更新时间 | 2024 年 2 月 |
模型代码 | models/gemini-pro |
|
模型功能 |
|
|
支持的生成方法 | generateContent |
|
输入令牌限制 | 30720 | |
输出词元限制 | 2048 | |
模型安全性 | 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。 | |
速率限制 | 每分钟 60 个请求 [1] | |
模型名称 |
|
|
Gemini 1.0 Pro Vision | 模型上次更新时间 | 2023 年 12 月 |
模型代码 | models/gemini-pro-vision |
|
模型功能 |
|
|
支持的生成方法 | generateContent |
|
输入令牌限制 | 12288 | |
输出词元限制 | 4096 | |
模型安全性 | 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。 | |
速率限制 | 每分钟 60 个请求 [1] | |
嵌入 | 模型上次更新时间 | 2023 年 12 月 |
模型代码 | models/embedding-001 |
|
模型功能 |
|
|
支持的生成方法 | embedContent |
|
模型安全性 | 没有可调整的安全设置。 | |
速率限制 | 每分钟 1500 个请求 [1] | |
文本嵌入 | 模型上次更新时间 | 2024 年 4 月 |
模型代码 | models/text-embedding-004 (Vertex AI 中的 text-embedding-preview-0409 )
|
|
模型功能 |
|
|
支持的生成方法 | embedContent |
|
模型安全性 | 没有可调整的安全设置。 | |
速率限制 | 每分钟 1500 个请求 [1] | |
空气质量分析 | 模型上次更新时间 | 2023 年 12 月 |
模型代码 | models/aqa |
|
模型功能 |
|
|
支持的生成方法 | generateAnswer |
|
支持的语言 | 英语 | |
输入令牌限制 | 7168 | |
输出词元限制 | 1024 | |
模型安全性 | 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。 | |
速率限制 | 每分钟 60 个请求 [1] |
请参阅示例,探索这些模型变体的功能。
模型元数据
使用 ModelService
API 获取有关最新模型的其他元数据,例如输入和输出令牌限制。下表显示了 Gemini Pro 模型变体的元数据。
属性 | 值 |
---|---|
显示名称 | Gemini 1.0 Pro |
模型代码 | models/gemini-1.0-pro |
说明 | 适用于文本生成的模型 |
支持的生成方法 | generateContent |
温度 | 0.9 |
top_p | 1 |
top_k | 1 |
模型属性
下表介绍了所有模型变体共有的 Gemini 模型属性。
属性 | 说明 |
---|---|
训练数据 | Gemini 的知识截止日期为 2023 年初。 对于该时间之后的事件,相关知识会受到限制。 |
支持的语言 | 查看支持的语言 |
可配置的模型参数 |
|
[1] 由于容量限制,无法保证指定的最大速率限制。
如需了解其中每个参数的信息,请参阅“LLM 简介”指南的模型参数部分。
后续步骤
- 如需通过无代码方式开始使用,请参阅 Google AI Studio 快速入门。
- 如需开始使用该 API,请参阅 Python 快速入门。