Gemini 模型

模型变体

Gemini API 提供了针对特定用例进行了优化的不同模型。下面简要介绍了可用的 Gemini 变体:

模型变体 输入 输出 优化目标
Gemini 2.0 Flash
gemini-2.0-flash
音频、图片、视频和文本 文本、图片(实验性功能)和音频(即将推出) 新一代功能、速度、思考、实时串流和多模式生成
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
音频、图片、视频和文本 文本 一款针对性价比和低延迟时间进行了优化的 Gemini 2.0 Flash 模型
Gemini 2.0 Pro 实验版
gemini-2.0-pro-exp-02-05
音频、图片、视频和文本 文本 我们最强大的 Gemini 2.0 模型
Gemini 1.5 Flash
gemini-1.5-flash
音频、图片、视频和文本 文本 在各种任务中提供快速、多样化的性能
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
音频、图片、视频和文本 文本 量大且智能程度较低的任务
Gemini 1.5 Pro
gemini-1.5-pro
音频、图片、视频和文本 文本 需要更高智能的复杂推理任务
Gemini 嵌入
gemini-embedding-exp
文本 文本嵌入 衡量文本字符串的相关性
Imagen 3
imagen-3.0-generate-002
文本 图片 我们最先进的图片生成模型

您可以在速率限制页面上查看每个模型的速率限制。

Gemini 2.0 Flash

Gemini 2.0 Flash 提供新一代功能和增强型功能,包括更快的速度、原生工具使用、多模态生成功能,以及 100 万个 token 的上下文窗口。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-2.0-flash
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本、图片(实验性功能)和音频(即将推出)

令牌限制[*]

输入令牌限制

1,048,576

输出令牌限制

8192

功能

结构化输出

支持

缓存

即将推出

调音

不受支持

函数调用

支持

代码执行

支持

搜索

支持

图片生成

实验性

原生工具使用

支持

音频生成

即将推出

Multimodal Live API

实验性

思考

实验性

版本
如需了解详情,请参阅模型版本模式
  • 最新电子邮件的接收日期:gemini-2.0-flash
  • 稳定:gemini-2.0-flash-001
  • 实验性:gemini-2.0-flash-exp
  • 实验性:gemini-2.0-flash-thinking-exp-01-21
最新更新 2025 年 2 月
知识截止分数 2024 年 8 月

Gemini 2.0 Pro Experimental

Gemini 2.0 Pro 是我们最强大的第二代 Gemini 模型,具有强大的推理能力、原生工具使用体验,以及 200 万个 token 的上下文窗口。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 gemini-2.0-pro-exp-02-05
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本

令牌限制[*]

输入令牌限制

2,048,576

输出令牌限制

8192

功能

结构化输出

支持

缓存

不受支持

调音

不受支持

函数调用

支持

代码执行

支持

搜索

支持

图片生成

不受支持

原生工具使用

支持

音频生成

不受支持

Multimodal Live API

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 实验性:gemini-2.0-pro-exp-02-05
  • 实验性:gemini-2.0-pro-exp
最新更新 2025 年 2 月
知识截止分数 2024 年 8 月

Gemini 2.0 Flash-Lite

一款 Gemini 2.0 Flash 模型,针对性价比和低延迟进行了优化。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-2.0-flash-lite
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本

令牌限制[*]

输入令牌限制

1,048,576

输出令牌限制

8192

功能

结构化输出

支持

缓存

不受支持

调音

不受支持

函数调用

不受支持

代码执行

不受支持

搜索

不受支持

图片生成

不受支持

原生工具使用

不受支持

音频生成

不受支持

Multimodal Live API

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 最新电子邮件的接收日期:gemini-2.0-flash-lite
  • 稳定:gemini-2.0-flash-lite-001
最新更新 2025 年 2 月
知识截止分数 2024 年 8 月

Gemini 1.5 Flash

Gemini 1.5 Flash 是一款快速且多才多艺的多模态模型,可跨多种任务进行扩缩。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-flash
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本

令牌限制[*]

输入令牌限制

1,048,576

输出令牌限制

8192

音频/视觉规范

每个问题的图片数量上限

3600

视频时长上限

1 小时

音频时长上限

大约 9.5 小时

功能

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调节的安全设置

支持

缓存

支持

调音

支持

函数调用

支持

代码执行

支持

双向流式传输

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 最新电子邮件的接收日期:gemini-1.5-flash-latest
  • 最新稳定版:gemini-1.5-flash
  • 稳定版:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
最新更新 2024 年 9 月

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B 是一款小型模型,专为处理需要较低智能度的任务而设计。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-flash-8b
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本

令牌限制[*]

输入令牌限制

1,048,576

输出令牌限制

8192

音频/视觉规范

每个问题的图片数量上限

3600

视频时长上限

1 小时

音频时长上限

大约 9.5 小时

功能

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调节的安全设置

支持

缓存

支持

调音

支持

函数调用

支持

代码执行

支持

双向流式传输

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 最新电子邮件的接收日期:gemini-1.5-flash-8b-latest
  • 最新稳定版:gemini-1.5-flash-8b
  • 稳定版:
    • gemini-1.5-flash-8b-001
最新更新 2024 年 10 月

Gemini 1.5 Pro

试用 Gemini 2.0 Pro Experimental,这是我们迄今为止最先进的 Gemini 模型。

Gemini 1.5 Pro 是一款中型多模态模型,经过优化,可处理各种推理任务。1.5 Pro 可以一次处理大量数据,包括 2 小时的视频、19 小时的音频、6 万行代码的代码库或 2,000 页的文本。

在 Google AI Studio 中试用

模型详情

属性 说明
模型代码 models/gemini-1.5-pro
支持的数据类型

输入源

音频、图片、视频和文本

输出

文本

令牌限制[*]

输入令牌限制

2,097,152

输出令牌限制

8192

音频/视觉规范

每个问题的图片数量上限

7,200

视频时长上限

2 小时

音频时长上限

大约 19 小时

功能

系统指令

支持

JSON 模式

支持

JSON 架构

支持

可调节的安全设置

支持

缓存

支持

调音

不受支持

函数调用

支持

代码执行

支持

双向流式传输

不受支持

版本
如需了解详情,请参阅模型版本模式
  • 最新电子邮件的接收日期:gemini-1.5-pro-latest
  • 最新稳定版:gemini-1.5-pro
  • 稳定版:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
最新更新 2024 年 9 月

Imagen 3

Imagen 3 是我们最出色的文本转图片模型,与之前的模型相比,它生成的图片细节更丰富、光线更丰富,干扰性伪影更少。

模型详情
属性 说明
模型代码

Gemini API

imagen-3.0-generate-002

支持的数据类型

输入

文本

输出

图片

令牌限制[*]

输入令牌限制

不适用

输出图片

最多 4 个

最新更新 2025 年 2 月

Gemini Embedding Experimental

Gemini embedding 在代码、多语言和检索等许多关键维度上都取得了世界领先的效果

模型详情
属性 说明
模型代码

Gemini API

gemini-embedding-exp-03-07

支持的数据类型

输入

文本

输出

文本嵌入

令牌限制[*]

输入令牌限制

8192

输出维度大小

弹性,支持:3072、1536 或 768

最新更新 2025 年 3 月

文本嵌入和嵌入

文本嵌入

试用我们全新的实验性 Gemini 嵌入模型,该模型可实现最先进的性能。

文本嵌入用于衡量字符串的相关性,在许多 AI 应用中都得到了广泛的应用。

在标准 MTEB 嵌入基准测试中,text-embedding-004 在具有类似维度的情形下,实现了更出色的检索性能,并且优于现有模型

模型详情
属性 说明
模型代码

Gemini API

models/text-embedding-004

支持的数据类型

输入

文本

输出

文本嵌入

令牌限制[*]

输入令牌限制

2048

输出维度大小

768

速率限制[**] 每分钟 1,500 个请求
可调节的安全设置 不受支持
最新更新 2024 年 4 月

嵌入

您可以使用嵌入模型为输入文本生成文本嵌入

该嵌入模型经过优化,可为最多 2,048 个令牌的文本创建 768 维的嵌入。

嵌入模型详情
属性 说明
模型代码 models/embedding-001
支持的数据类型

输入

文本

输出

文本嵌入

令牌限制[*]

输入令牌限制

2048

输出维度大小

768

速率限制[**] 每分钟 1,500 个请求
可调节的安全设置 不受支持
最新更新 2023 年 12 月

AQA

您可以使用 AQA 模型对文档、语料库或一组段落执行归因式问答 (AQA) 相关任务。AQA 模型会返回基于提供的来源对问题的回答,并估算可回答的概率。

模型详情

属性 说明
模型代码 models/aqa
支持的数据类型

输入

文本

输出

文本

支持的语言 英语
令牌限制[*]

输入令牌限制

7168

输出令牌限制

1024

速率限制[**] 每分钟 1,500 个请求
可调节的安全设置 支持
最新更新 2023 年 12 月

请参阅示例,探索这些模型变体的功能。

[*] 对于 Gemini 模型,一个令牌相当于大约 4 个字符。100 个词元大约相当于 60-80 个英语单词。

模型版本名称模式

Gemini 模型有预览版稳定版两种版本。在代码中,您可以使用以下任一模型名称格式来指定要使用的模型和版本。

  • 最新:指向指定生成和变体的尖端模型版本。底层模型会定期更新,并且可能是预览版。只有探索性测试应用和原型才应使用此别名。

    如需指定最新版本,请使用以下格式:<model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新稳定版:指向为指定的模型生成和变体发布的最新稳定版。

    如需指定最新的稳定版本,请使用以下模式:<model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 稳定:指向特定的稳定模型。稳定型模型通常不会发生变化。大多数正式版应用都应使用特定的稳定型模型。

    如需指定稳定版本,请使用以下模式:<model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

  • 实验性:指向实验性模型(不适用于生产环境)。 我们发布实验性模型是为了收集反馈、快速将最新动态交到开发者手中,并突出展示 Google 的创新步伐。

    如需指定实验版本,请使用以下格式:<model>-<generation>-<variation>-<version>。例如 gemini-2.0-pro-exp-02-05

实验性模型

除了可用于生产环境的模型之外,Gemini API 还提供实验性模型(如条款中所定义,不适用于生产环境)。

我们发布实验性模型是为了收集反馈、快速将最新动态交到开发者手中,并突出展示 Google 的创新步伐。我们会通过发布实验版积累经验,以便我们的正式版模型能更好地服务更多用户。实验性模型可以在不事先通知的情况下换成另一个模型。我们不保证实验性模型将来会成为稳定模型。

先前的实验性模型

随着新版本或稳定版的推出,我们会移除并替换实验性模型。您可以在下一部分中找到我们之前发布的实验性模型以及替换版本:

模型代码 基本模型 替换版本
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

支持的语言

Gemini 模型经过训练,可处理以下语言:

  • 阿拉伯语 (ar)
  • 孟加拉语 (bn)
  • 保加利亚语 (bg)
  • 简体中文和繁体中文 (zh)
  • 克罗地亚语 (hr)
  • 捷克语 (cs)
  • 丹麦语 (da)
  • 荷兰语 (nl)
  • 英语 (en)
  • 爱沙尼亚语 (et)
  • 芬兰语 (fi)
  • 法语 (fr)
  • 德语 (de)
  • 希腊语 (el)
  • 希伯来语 (iw)
  • 印地语 (hi)
  • 匈牙利语 (hu)
  • 印度尼西亚语 (id)
  • 意大利语 (it)
  • 日语 (ja)
  • 韩语 (ko)
  • 拉脱维亚语 (lv)
  • 立陶宛语 (lt)
  • 挪威语 (no)
  • 波兰语 (pl)
  • 葡萄牙语 (pt)
  • 罗马尼亚语 (ro)
  • 俄语 (ru)
  • 塞尔维亚语 (sr)
  • 斯洛伐克语 (sk)
  • 斯洛维尼亚语 (sl)
  • 西班牙语 (es)
  • 斯瓦希里语 (sw)
  • 瑞典语 (sv)
  • 泰语 (th)
  • 土耳其语 (tr)
  • 乌克兰语 (uk)
  • 越南语 (vi)