Gemini 模型

模型变体

Gemini API 提供了针对特定用途进行了优化的不同模型 案例下面简要概述了可用的 Gemini 变体:

模型变体 输入 输出 优化目标
Gemini 1.5 Flash
gemini-1.5-flash
音频、图片、视频和文字 文本 以多种方式快速处理各种任务
Gemini 1.5 Pro
gemini-1.5-pro
音频、图片、视频和文字 文本 复杂的推理任务,如代码和文本生成, 文本编辑、问题解决、数据提取和生成
Gemini 1.0 Pro
gemini-1.0-pro
文本 文本 自然语言任务、多轮文本和代码聊天以及代码 世代
文本嵌入
text-embedding-004
文本 文本嵌入 衡量文本字符串的相关性
AQA
aqa
文本 文本 提供以来源为依据的答案

下表介绍了 Gemini 模型的 在所有模型变体中共有:

属性 说明
训练数据 Gemini 的知识截止时间是 2023 年 11 月。 在此时间之后,有关活动的方面的信息会受到限制。
支持的语言 查看支持的语言
可配置的模型参数
  • 顶部 p
  • 前 k 名
  • 温度
  • 停止序列
  • 输出长度上限
  • 候选响应数量

有关详情,请参阅模型参数 部分 生成模型指南。

Gemini 1.5 Flash

Gemini 1.5 Flash 是一种快速、用途多样的多模态模型,可用于扩大 各种任务。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-flash
支持的数据类型

输入源

音频、图片、视频和文字

输出

文本

令牌限制[*]

输入词元限制

1,048,576,000

输出词元限制

8192

音频/视频规范

每个提示对应的图片数量上限

3,600

视频时长上限

1 小时

音频时长上限

大约 9.5 小时

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 15 次
  • 100 万 TPM
  • 1500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 1,000 RPM
  • 400 万 TPM
Capabilities

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调整的安全设置

支持

缓存

支持

微调

支持

函数调用

支持

函数调用配置

支持

代码执行

支持

版本
  • 最新电子邮件的接收日期:gemini-1.5-flash-latest
  • 最新稳定版:gemini-1.5-flash
  • 稳定:gemini-1.5-flash-001
  • 实验性
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
最新动态 2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是一个中型多模态模型, 各种各样的推理任务。1.5 Pro 可以处理大量数据 (包括 2 小时的视频、19 小时的音频、 6 万行代码或 2,000 页文字。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-pro
支持的数据类型

输入源

音频、图片、视频和文字

输出

文本

令牌限制[*]

输入词元限制

2,097,152,000

输出词元限制

8192

音频/视频规范

每个提示对应的图片数量上限

7,200

视频时长上限

2 小时

音频时长上限

大约 19 小时

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 2 次
  • 32,000 TPM
  • 50 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 转/分钟
  • 400 万 TPM
Capabilities

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调整的安全设置

支持

缓存

支持

微调

不受支持

函数调用

支持

函数调用配置

支持

代码执行

支持

版本
  • 最新电子邮件的接收日期:gemini-1.5-pro-latest
  • 最新稳定版:gemini-1.5-pro
  • 稳定:gemini-1.5-pro-001
  • 实验性
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
最新动态 2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro 是一个 NLP 模型,用于处理多轮文本和 代码聊天和代码生成。

在 AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.0-pro
支持的数据类型

输入

文本

输出

文本

速率限制[**] <ph type="x-smartling-placeholder">
</ph> 免费
  • 每分钟 15 次
  • 32,000 TPM
  • 1500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 转/分钟
  • 120,000 TPM
  • 30,000 RPD
Capabilities

系统指令

不受支持

JSON 模式

不受支持

JSON 架构

不受支持

可调整的安全设置

支持

缓存

不受支持

微调

支持

函数调用

支持

函数调用配置

不受支持

代码执行

不受支持

版本
  • 最新电子邮件的接收日期:gemini-1.0-pro-latest
  • 最新稳定版:gemini-1.0-pro
  • 稳定:gemini-1.0-pro-001
最新动态 2024 年 2 月
<ph type="x-smartling-placeholder">

文本嵌入和嵌入

文本嵌入

文本嵌入用于衡量字符串的相关性,广泛应用于 许多 AI 应用。

text-embedding-004 可实现更强的检索性能,并且优于现有模型 (基于标准的 MTEB 嵌入基准测试)。

模型详情
属性 说明
模型代码

Gemini API

models/text-embedding-004

支持的数据类型

输入

文本

输出

文本嵌入

令牌限制[*]

输入词元限制

2048

输出维度大小

768

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 不受支持
最新动态 2024 年 4 月

嵌入

<ph type="x-smartling-placeholder">

您可以使用嵌入模型 文本嵌入: 输入文本。

嵌入模型针对创建具有 768 个维度的嵌入进行了优化 最多支持 2,048 个词元的文本。

嵌入模型详细信息
属性 说明
模型代码 models/embedding-001
支持的数据类型

输入

文本

输出

文本嵌入

令牌限制[*]

输入词元限制

2048

输出维度大小

768

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 不受支持
最新动态 2023 年 12 月

AQA

您可以使用 AQA 模型 归因问答 针对某个文档、语料库或一组段落执行的相关任务。AQA 模型会根据所提供的来源为问题返回答案, 以及估计可回答概率。

模型详情

属性 说明
模型代码 models/aqa
支持的数据类型

输入

文本

输出

文本

支持的语言 英语
令牌限制[*]

输入词元限制

7168

输出词元限制

1024

速率限制[**] 每分钟 1500 个请求
可调整的安全设置 支持
最新动态 2023 年 12 月

如需了解这些模型的功能,请查看示例 变体。

[*] 对于 Gemini 模型,一个词元大约相当于 4 个字符。100 个词元 大约有 60-80 个英语单词。

[**] RPM:每分钟请求数
TPM:每分钟令牌数
RPD:每日请求数
TPD:每日令牌数

由于容量限制,未指定的最大速率限制 。

模型版本名称模式

Gemini 模型提供预览版稳定版本。在 代码,您可以使用以下模型名称格式之一来指定 和版本。

  • 最新:指向特定参数 生成和变体。底层模型会定期更新,并且可能 为预览版。只有探索性测试应用和原型才应 使用此别名。

    如需指定最新版本,请使用以下模式: <model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新稳定版:指向 模型生成和变体。

    如需指定最新的稳定版本,请使用以下模式: <model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 稳定:指向特定的稳定模型。稳定的模型不会发生变化。 大多数正式版应用都应使用特定的稳定模型。

    如需指定稳定版,请使用以下模式: <model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

  • 实验性:指向预览版中提供的实验性模型, 如条款中所定义, 这意味着它不用于生产环境我们发布实验模型, 来收集反馈,向开发者提供我们的最新更新 并凸显 Google 的创新步伐。内容 我们从实验性发布中汲取经验,有助于我们更好地发布模型 。可以将一个实验性模型替换为另一个,而无需先行 通知。我们不保证某个实验性模型 更稳定的模型。

    如需指定实验性版本,请使用以下模式: <model>-<generation>-<variation>-<version>。例如 gemini-1.5-pro-exp-0801

支持的语言

Gemini 模型经过训练,支持以下语言:

  • 阿拉伯语 (ar)
  • 孟加拉语 (bn)
  • 保加利亚语 (bg)
  • 简体中文和繁体中文 (zh)
  • 克罗地亚语 (hr)
  • 捷克语 (cs)
  • 丹麦语 (da)
  • 荷兰语 (nl)
  • 英语 (en)
  • 爱沙尼亚语 (et)
  • 芬兰语 (fi)
  • 法语 (fr)
  • 德语 (de)
  • 希腊语 (el)
  • 希伯来语 (iw)
  • 印地语 (hi)
  • 匈牙利语 (hu)
  • 印度尼西亚语 (id)
  • 意大利语 (it)
  • 日语 (ja)
  • 韩语 (ko)
  • 拉脱维亚语 (lv)
  • 立陶宛语 (lt)
  • 挪威语 (no)
  • 波兰语 (pl)
  • 葡萄牙语 (pt)
  • 罗马尼亚语 (ro)
  • 俄语 (ru)
  • 塞尔维亚语 (sr)
  • 斯洛伐克语 (sk)
  • 斯洛维尼亚语 (sl)
  • 西班牙语 (es)
  • 斯瓦希里语 (sw)
  • 瑞典语 (sv)
  • 泰语 (th)
  • 土耳其语 (tr)
  • 乌克兰语 (uk)
  • 越南语 (vi)