Gemini 模型

Gemini 是一系列生成式 AI 模型,可让开发者生成内容并解决问题。这些模型经过设计和训练,可将文本和图片都处理为输入。本指南提供了有关每个模型变体的信息,可帮助您确定哪个模型变体最契合您的用例。

下面简要介绍了可用模型及其功能:

模型 输入 输出
双子座
  • Gemini 1.5 Pro(仅限预览版)
文字和图片 文字
  • Gemini 1.0 Pro
文字 文字
  • Gemini 1.0 Pro Vision
文字和图片 文字
嵌入
  • 嵌入
文字 文本嵌入
检索
  • AQA
文字 文字

安全和预期用途

生成式人工智能模型是功能强大的工具,但并非没有限制。其多功能性和适用性有时可能会导致意外输出,例如不准确、有偏见或冒犯性的输出。后期处理和严格的手动评估对于限制此类输出造成伤害的风险至关重要。如需了解更多安全使用建议,请参阅安全指南

Gemini API 提供的模型可用于各种生成式 AI 和自然语言处理 (NLP) 应用。您只能通过 Gemini API 或 Google AI Studio Web 应用使用这些函数。使用 Gemini API 时还必须遵守生成式 AI 使用限制政策Gemini API 服务条款

模型尺寸

下表显示了可用的尺寸及其相对含义。

模型大小 说明 服务
Gemini 1.0 Pro 平衡功能和效率的模型大小。
  • text
  • 聊天

模型版本

Gemini 模型提供预览版稳定版两种版本。在您的代码中,您可以使用以下模型名称格式之一来指定要使用的模型和版本。

  • 最新:指向指定世代和变体的尖端模型。底层模型会定期更新,它可能是预览版。只有探索性测试应用和原型才能使用此别名。

    如需指定最新版本,请使用以下格式:<model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新稳定版:指向针对指定的模型生成和变体发布的最新稳定版。

    如需指定最新的稳定版,请使用以下格式:<model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 稳定版:指向特定的稳定版模型。稳定的模型不会改变。大多数正式版应用都应使用特定的稳定模型。

    如需指定稳定版,请使用以下格式:<model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

对于具有稳定版的模型,请参阅模型变体中相应模型的“模型名称”行。

模型变体

Gemini API 提供针对特定应用场景优化的不同模型。下表介绍了每个表的属性。

变体 属性 说明
Gemini 1.5 Pro(仅限预览版) 模型上次更新时间 2024 年 4 月
模型代码 models/gemini-1.5-pro-latest
模型功能
  • 输入:音频、图片、文字
  • 输出:文本
  • 针对语言任务进行了优化,例如:
    • 代码生成
    • 文本生成
    • 文本编辑
    • 解决问题
    • 生成建议
    • 信息提取
    • 数据提取或生成
    • AI 代理
  • 可以处理 0 项、1 项和少样本任务。
支持的生成方法 generateContent
输入令牌限制 1048576
输出词元限制 8192
模型安全性 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。
速率限制 每分钟 2 次查询,每天 1000 次查询 [1]
Gemini Pro 模型上次更新时间 2024 年 2 月
模型代码 models/gemini-pro
模型功能
  • 输入:文字
  • 输出:文本
  • 生成文本。
  • 可以处理多轮对话形式。
  • 可以处理 0 项、1 项和少样本任务。
支持的生成方法 generateContent
输入令牌限制 30720
输出词元限制 2048
模型安全性 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。
速率限制 每分钟 60 个请求 [1]
模型名称
  • 最新版本gemini-1.0-pro-latest
  • 最新稳定版gemini-1.0-pro
  • 稳定版
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision 模型上次更新时间 2023 年 12 月
模型代码 models/gemini-pro-vision
模型功能
  • 输入:文字和图片
  • 输出:文本
  • 可以接受多模态输入、文本和图片。
  • 可以处理 0 项、1 项和少样本任务。
支持的生成方法 generateContent
输入令牌限制 12288
输出词元限制 4096
模型安全性 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。
速率限制 每分钟 60 个请求 [1]
嵌入 模型上次更新时间 2023 年 12 月
模型代码 models/embedding-001
模型功能
  • 输入:文字
  • 输出:文本
  • 为输入文本生成文本嵌入。
  • 专为最多包含 2048 个词元的文本创建嵌入进行了优化。
支持的生成方法 embedContent
模型安全性 没有可调整的安全设置。
速率限制 每分钟 1500 个请求 [1]
文本嵌入 模型上次更新时间 2024 年 4 月
模型代码 models/text-embedding-004Vertex AI 中的 text-embedding-preview-0409
模型功能
  • 输入:文字
  • 输出:文本
  • 为输入文本生成文本嵌入。
  • 支持低于 768 的弹性嵌入大小。
支持的生成方法 embedContent
模型安全性 没有可调整的安全设置。
速率限制 每分钟 1500 个请求 [1]
空气质量分析 模型上次更新时间 2023 年 12 月
模型代码 models/aqa
模型功能
  • 输入:文字
  • 输出:文本
  • 执行归因式问题解答的模型。
  • 模型经过训练后,可返回基于所提供来源的问题的答案,以及估算可回答的概率。
支持的生成方法 generateAnswer
支持的语言 英语
输入令牌限制 7168
输出词元限制 1024
模型安全性 自动应用的安全设置,可由开发者调整。 如需了解详情,请参阅安全设置主题。
速率限制 每分钟 60 个请求 [1]

请参阅示例,探索这些模型变体的功能。

模型元数据

使用 ModelService API 获取有关最新模型的其他元数据,例如输入和输出令牌限制。下表显示了 Gemini Pro 模型变体的元数据。

属性
显示名称 Gemini 1.0 Pro
模型代码 models/gemini-1.0-pro
说明 适用于文本生成的模型
支持的生成方法 generateContent
温度 0.9
top_p 1
top_k 1

模型属性

下表介绍了所有模型变体共有的 Gemini 模型属性。

属性 说明
训练数据 Gemini 的知识截止日期为 2023 年初。 对于该时间之后的事件,相关知识会受到限制。
支持的语言 查看支持的语言
可配置的模型参数
  • 前 p
  • 前 k 个
  • 温度
  • 停止序列
  • 最大输出长度
  • 候选响应数量

[1] 由于容量限制,无法保证指定的最大速率限制。

如需了解其中每个参数的信息,请参阅“LLM 简介”指南的模型参数部分。

后续步骤