Gemini Developer API 价格

免费开始构建,享受宽裕的额度;待应用准备好投入生产后,可先选用预付费模式,再按需切换为随用随付模式进行扩容。

免费

适用于刚开始使用 Gemini API 的开发者和小型项目。

  • check_circle对特定模型的访问权限有限
  • check_circle免费输入和输出 token
  • check_circleGoogle AI Studio 访问权限
  • check_circle内容会用于改进 Google 产品*
免费开始使用

企业

适用于在安全性、支持及合规性方面有自定义需求的大规模部署,由 Gemini Enterprise Agent Platform 提供支持。

  • check_circle付费层级的所有功能,以及以下可选功能:
  • check_circle专属支持渠道
  • check_circle高级安全与合规功能
  • check_circle预配吞吐量
  • check_circle阶梯折扣(基于用量)
  • check_circleMLOps、Model Garden 等
联系销售团队

Gemini 3.5 Flash

gemini-3.5-flash

在 Google AI Studio 中试用

Google 最智能的模型,专为速度而打造,将前沿智能与卓越的搜索和接地能力完美结合。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 $1.50
输出价格(包括思考 token) 免费 9.00 美元
上下文缓存价格 免费 0.15 美元
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 $0.75
输出价格(包括思考 token) 不可用 $4.50
上下文缓存价格 不可用 0.075 美元
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 $0.75
输出价格(包括思考 token) 不可用 $4.50
上下文缓存价格 不可用 0.08 美元
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 $2.70
输出价格(包括思考 token) 免费 16.20 美元
上下文缓存价格 免费 0.27 美元
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 3.5 实时翻译

gemini-3.5-live-translate-preview

在 Google AI Studio 中试用

Google 的低延迟实时语音转语音翻译模型,支持 70 多种语言。

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 3.50 美元或 0.0053 美元/分钟*(音频)
输出价格(包括思考 token) 免费 21.00 美元或 0.0315 美元/分钟*(音频)
用于改进 Google 产品

* 费用根据音频输入和输出 token 的总消耗量计算,换算标准为每秒音频 25 个 token,相当于每分钟的有效价格约为 0.0368 美元。

Gemini 3.1 Flash-Lite

gemini-3.1-flash-lite

在 Google AI Studio 中试用

Google 最具成本效益的模型,针对高调用量智能体任务、翻译和简单的数据处理进行了优化。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.25 美元(文本 / 图片 / 视频)
0.50 美元(音频)
输出价格(包括思考 token) 免费 $1.50
上下文缓存价格 不可用 0.025 美元(文本/图片/视频)
0.05 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.125 美元(文本 / 图片 / 视频)
0.25 美元(音频)
输出价格(包括思考 token) 免费 $0.75
上下文缓存价格 不可用 0.0125 美元(文本/图片/视频)
0.025 美元(音频)
0.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.125 美元(文本 / 图片 / 视频)
0.25 美元(音频)
输出价格(包括思考 token) 免费 $0.75
上下文缓存价格 不可用 0.0125 美元(文本/图片/视频)
0.025 美元(音频)
0.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.45 美元(文本 / 图片 / 视频)
0.90 美元(音频)
输出价格(包括思考 token) 免费 $2.70
上下文缓存价格 不可用 0.045 美元(文本/图片/视频)
0.09 美元(音频)
1.80 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 3 Pro 预览版

gemini-3.1-pro-previewgemini-3.1-pro-preview-customtools

在 Google AI Studio 中试用

针对全球领先的多模态理解、智能体功能和氛围编程 (vibe coding) 模型系列,在性能、智能和易用性方面进行了全新升级。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 2.00 美元:提示 <= 20 万个 token
4.00 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 12.00 美元:提示 <= 20 万个 token
18.00 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.20 美元:提示 <= 20 万个 token
0.40 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.00 美元:提示 <= 20 万个 token
2.00 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 6.00 美元:提示 <= 20 万个 token
9.00 美元:提示 > 20 万个 token
上下文缓存价格 不可用 与标准层级相同
0.20 美元:提示 <= 20 万个 token
0.40 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.00 美元:提示 <= 20 万个 token
2.00 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 6.00 美元:提示 <= 20 万个 token
9.00 美元:提示 > 20 万个 token
上下文缓存价格 不可用 与标准层级相同
0.20 美元:提示 <= 20 万个 token
0.40 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 3.60 美元:提示 <= 20 万个 token
7.20 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 21.60 美元:提示 <= 20 万个 token
32.40 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.36 美元:提示 <= 20 万个 token
0.72 美元:提示 > 20 万个 token
8.10 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 3.1 Flash Live 预览版

gemini-3.1-flash-live-preview

在 Google AI Studio 中试用

Google 的低延迟音频转音频模型,针对实时对话场景进行了优化,具备声学细微差别检测、数值精准处理及多模态感知能力。

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.75 美元(文本)
3.00 美元或 0.005 美元/分钟(音频)
1.00 美元或 0.002 美元/分钟(图片/视频)
输出价格(包括思考 token) 免费 4.50 美元(文本)
12.00 美元或 0.018 美元/分钟(音频)
依托 Google 搜索进行接地* 支持 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 3.1 Flash Image 🍌

gemini-3.1-flash-image

在 Google AI Studio 中试用

Gemini 3.1 Flash 图片生成模型专为速度和效率而打造,非常适合快速交互式响应和高吞吐量场景。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.50 美元(文本/图片)
输出价格 不可用 3 美元(文本和思考)
60.00 美元(图片)
相当于每张 0.5K 图片 0.045 美元*
每张 1K 图片 0.067 美元*、 每张 2K 图片 0.101 美元*, 以及每张 4K 图片 0.151 美元*
依托 Google 搜索进行接地** 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后针对基于文本和图片的接地,按每 1,000 次搜索查询 14 美元计费。
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.25 美元(文本、图片)
输出价格 不可用 1.50 美元(文本和思考)
30.00 美元(图片)
相当于每张 0.5K 图片 0.022 美元*
每张 1K 图片 0.034 美元*
每张 2K 图片 0.050 美元*
以及每张 4K 图片 0.076 美元*
用于改进 Google 产品

* 图片输出的价格为 60 美元/100 万个 token。分辨率为 0.5K (512px) 的输出图片会消耗 747 个 token,相当于每张图片 0.045 美元。分辨率为 1K (1024x1024px) 的输出图片会消耗 1120 个 token,相当于每张图片 0.067 美元。分辨率为 2K (2048x2048px) 的输出图片会消耗 1680 个 token,相当于每张图片 0.101 美元。分辨率为 4K (4096x4096px) 的输出图片会消耗 2520 个 token,相当于每张图片 0.151 美元。

** 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。通过“依托 Google 搜索进行接地”功能检索到的上下文(文本或图片)不计入输入 token 费用。

Gemini 3.1 Flash TTS 预览版

gemini-3.1-flash-tts-preview

在 Google AI Studio 中试用

Google 的 3.1 Flash 文字转语音音频模型,经过优化,可实现高性价比、低延迟且可控的语音生成。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 1.00 美元(文本)
输出价格 免费 20.00 美元(音频)
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.50 美元(文本)
输出价格 不可用 10.00 美元(音频)
用于改进 Google 产品

* 音频 token 的换算标准为每秒音频 25 个 token。

Gemini 3 Flash 预览版

gemini-3-flash-preview

在 Google AI Studio 中试用

Google 最智能的模型,专为速度而打造,将前沿智能与卓越的搜索和接地能力完美结合。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.50 美元(文本 / 图片 / 视频)
1.00 美元(音频)
输出价格(包括思考 token) 免费 $3.00
上下文缓存价格 免费 0.05 美元(文本/图片/视频)
0.10 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.25 美元(文本 / 图片 / 视频)
0.50 美元(音频)
输出价格(包括思考 token) 不可用 $1.50
上下文缓存价格 不可用 与标准层级相同
0.05 美元(文本/图片/视频)
0.10 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.25 美元(文本 / 图片 / 视频)
0.50 美元(音频)
输出价格(包括思考 token) 不可用 $1.50
上下文缓存价格 不可用 与标准层级相同
0.05 美元(文本/图片/视频)
0.10 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.90 美元(文本 / 图片 / 视频)
1.80 美元(音频)
输出价格(包括思考 token) 免费 $5.40
上下文缓存价格 免费 0.09 美元(文本/图片/视频)
0.18 美元(音频)
1.80 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地* 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
依托 Google 地图进行接地 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 3 Pro Image 🍌

gemini-3-pro-image

在 Google AI Studio 中试用

Google 的原生图片生成模型,针对速度、灵活性和上下文理解进行了优化。文本输入和输出的价格与 Gemini 3.1 Pro 相同。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 2.00 美元(文本/图片),
相当于每张图片 0.0011 美元*
输出价格 不可用 12.00 美元(文本和思考)
120.00 美元(图片)
相当于每张 1K/2K 图片 0.134 美元**
每张 4K 图片 0.24 美元**
依托 Google 网页搜索和图片搜索进行接地*** 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.00 美元(文本),
0.0006 美元(图片)*
输出价格 不可用 6.00 美元(文本和思考)
每张 1K/2K 图片 0.067 美元**
每张 4K 图片 0.12 美元**
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.00 美元(文本),
0.0006 美元(图片)*
输出价格 不可用 6.00 美元(文本和思考)
每张 1K/2K 图片 0.067 美元**
每张 4K 图片 0.12 美元**
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 3.60 美元(文本/图片)
输出价格 不可用 21.60 美元(文本和思考)
216.00 美元(图片)
依托 Google 网页搜索和图片搜索进行接地*** 不可用 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费
用于改进 Google 产品

* 图片输入计费标准为每张图片 560 个 token 或 0.0011 美元。

**图片输出的价格为 120 美元/100 万个 token。分辨率介于 1024x1024px (1K) 到 2048x2048px (2K) 之间的输出图片会消耗 1120 个 token,相当于每张图片 0.134 美元。分辨率最高为 4096x4096px (4K) 的输出图片会消耗 2000 个 token,相当于每张图片 0.24 美元。

*** 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。

Gemini 2.5 Pro

gemini-2.5-pro

在 Google AI Studio 中试用

Google 的前沿多用途模型,在编程和复杂推理任务方面表现卓越。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 1.25 美元:提示 <= 20 万个 token
2.50 美元:提示 > 20 万个 token
输出价格(包括思考 token) 免费 10.00 美元:提示 <= 20 万个 token
15.00 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.125 美元:提示 <= 20 万个 token
0.25 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 10,000 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.625 美元:提示 <= 20 万个 token
1.25 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 5.00 美元:提示 <= 20 万个 token
7.50 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.125 美元:提示 <= 20 万个 token
0.25 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.625 美元:提示 <= 20 万个 token
1.25 美元:提示 > 20 万个 token
输出价格(包括思考 token) 不可用 5.00 美元:提示 <= 20 万个 token
7.50 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.125 美元:提示 <= 20 万个 token
0.25 美元:提示 > 20 万个 token
4.50 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 2.25 美元:提示 <= 20 万个 token
4.50 美元:提示 > 20 万个 token
输出价格(包括思考 token) 免费 18.00 美元:提示 <= 20 万个 token
27.00 美元:提示 > 20 万个 token
上下文缓存价格 不可用 0.225 美元:提示 <= 20 万个 token
0.45 美元:提示 > 20 万个 token
8.10 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 10,000 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

Gemini 2.5 Flash

gemini-2.5-flash

在 Google AI Studio 中试用

Google 首款混合推理模型,支持 100 万 token 的上下文窗口,并配备了思考预算功能。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.30 美元(文本 / 图片 / 视频)
1.00 美元(音频)
输出价格(包括思考 token) 免费 $2.50
上下文缓存价格 不可用 0.03 美元(文本/图片/视频)
0.1 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 免费,最多 500 RPD(与 Flash-Lite RPD 共享此限额) 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.15 美元(文本 / 图片 / 视频)
0.50 美元(音频)
输出价格(包括思考 token) 不可用 $1.25
上下文缓存价格 不可用 0.03 美元(文本/图片/视频)
0.1 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.15 美元(文本 / 图片 / 视频)
0.50 美元(音频)
输出价格(包括思考 token) 不可用 $1.25
上下文缓存价格 不可用 0.03 美元(文本/图片/视频)
0.1 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.54 美元(文本 / 图片 / 视频)
1.80 美元(音频)
输出价格(包括思考 token) 免费 $4.50
上下文缓存价格 不可用 0.054 美元(文本/图片/视频)
0.18 美元(音频)
1.80 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 免费,最多 500 RPD(与 Flash-Lite RPD 共享此限额) 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

Gemini 2.5 Flash-Lite

gemini-2.5-flash-lite

在 Google AI Studio 中试用

Google 体积最小、性价比最高的模型,专为大规模应用场景而打造。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 免费 0.10 美元(文本 / 图片 / 视频)
0.30 美元(音频)
输出价格(包括思考 token) 免费 $0.40
上下文缓存价格 不可用 0.01 美元(文本/图片/视频)
0.03 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 免费,最多 500 RPD(与 Flash RPD 共享此限额) 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 不可用 0.05 美元(文本 / 图片 / 视频)
0.15 美元(音频)
输出价格(包括思考 token) 不可用 $0.20
上下文缓存价格 不可用 0.01 美元(文本/图片/视频)
0.03 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 不可用 0.05 美元(文本 / 图片 / 视频)
0.15 美元(音频)
输出价格(包括思考 token) 不可用 $0.20
上下文缓存价格 不可用 0.01 美元(文本/图片/视频)
0.03 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 免费 0.18 美元(文本 / 图片 / 视频)
0.54 美元(音频)
输出价格(包括思考 token) 免费 $0.72
上下文缓存价格 不可用 0.018 美元(文本/图片/视频)
0.054 美元(音频)
1.80 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 免费,最多 500 RPD(与 Flash RPD 共享此限额) 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

Gemini 2.5 Flash-Lite 预览版

gemini-2.5-flash-lite-preview-09-2025

在 Google AI Studio 中试用

基于 Gemini 2.5 Flash Lite 打造的全新模型,专为极致性价比、高吞吐量和卓越品质而优化。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 免费 0.10 美元(文本 / 图片 / 视频)
0.30 美元(音频)
输出价格(包括思考 token) 免费 $0.40
上下文缓存价格 不可用 0.01 美元(文本/图片/视频)
0.03 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 免费,最多 500 RPD(与 Flash RPD 共享此限额) 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格(文字、图片、视频) 不可用 0.05 美元(文本 / 图片 / 视频)
0.15 美元(音频)
输出价格(包括思考 token) 不可用 $0.20
上下文缓存价格 不可用 0.01 美元(文本/图片/视频)
0.03 美元(音频)
1.00 美元/100 万个 token/小时(存储价格)
依托 Google 搜索进行接地 不可用 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费
用于改进 Google 产品

Gemini 2.5 Flash Native Audio (Live API)

gemini-2.5-flash-native-audio-preview-12-2025

在 Google AI Studio 中试用

Google 的 Live API 原生音频模型,经过优化,可输出更高质量的音频,在语速节奏、语音自然度、表达丰富度及情绪表现力上均有提升。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.50 美元(文本)
3.00 美元(音频 / 视频)
输出价格(包括思考 token) 免费 2.00 美元(文本)
12.00 美元(音频)
用于改进 Google 产品

Gemini 2.5 Flash Image 🍌

gemini-2.5-flash-image

在 Google AI Studio 中试用

Google 的原生图片生成模型,针对速度、灵活性和上下文理解进行了优化。文本输入和输出的价格与 2.5 Flash 相同。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.30 美元(文本 / 图片)
输出价格 不可用 0.039 美元/张图片*
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.15 美元(文本 / 图片)
输出价格 不可用 0.0195 美元/张图片*
用于改进 Google 产品

Flex

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.15 美元(文本 / 图片)
输出价格 不可用 0.0195 美元/张图片*
用于改进 Google 产品

优先级

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.54 美元(文本 / 图片)
输出价格 不可用 每张图片 0.0702 美元*
用于改进 Google 产品

[*] 图片输出的价格为 30 美元/100 万个 token。分辨率最高为 1024x1024px 的输出图片会消耗 1290 个 token,相当于每张图片 0.039 美元。

Gemini 2.5 Flash 预览版 TTS

gemini-2.5-flash-preview-tts

在 Google AI Studio 中试用

Google 的 2.5 Flash 文字转语音音频模型,经过优化,可实现高性价比、低延迟、可控的语音生成。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.50 美元(文本)
输出价格 免费 10.00 美元(音频)
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.25 美元(文本)
输出价格 不可用 5.00 美元(音频)
用于改进 Google 产品

Gemini 2.5 Pro 预览版 TTS

gemini-2.5-pro-preview-tts

在 Google AI Studio 中试用

Google 的 2.5 Pro 文字转语音音频模型,经过优化,具备强大的低延迟语音生成能力,语音输出更自然,提示引导也更易实现。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.00 美元(文本)
输出价格 不可用 20.00 美元(音频)
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.50 美元(文本)
输出价格 不可用 10.00 美元(音频)
用于改进 Google 产品

Gemini 2.0 Flash

gemini-2.0-flash

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 0.10 美元(文本 / 图片 / 视频)
0.70 美元(音频)
输出价格 免费 $0.40
上下文缓存价格 免费 0.025 美元 / 100 万个 token(文本/图片/视频)
0.175 美元 / 100 万个 token(音频)
上下文缓存(存储) 不可用 1.00 美元/100 万个 token/小时
图片生成价格 不适用(已关停 不适用(已关停
调优价格 不可用 不可用
依托 Google 搜索进行接地 免费,最多 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 500 RPD 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.05 美元(文本 / 图片 / 视频)
0.35 美元(音频)
输出价格 不可用 $0.20
上下文缓存价格 不可用 0.025 美元 / 100 万个 token(文本/图片/视频)
0.175 美元 / 100 万个 token(音频)
上下文缓存(存储) 不可用 1.00 美元/100 万个 token/小时
图片生成价格 不适用(已关停 不适用(已关停
调优价格 不可用 不可用
依托 Google 搜索进行接地 不可用 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费
依托 Google 地图进行接地 不可用 不可用
用于改进 Google 产品

[*] 图片输出的价格为 30 美元/100 万个 token。分辨率最高为 1024x1024px 的输出图片会消耗 1290 个 token,相当于每张图片 0.039 美元。

Gemini 2.0 Flash-Lite

gemini-2.0-flash-lite

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 $0.075
输出价格 免费 $0.30
上下文缓存价格 不可用 不可用
上下文缓存(存储) 不可用 不可用
调优价格 不可用 不可用
依托 Google 搜索进行接地 不可用 不可用
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 $0.0375
输出价格 不可用 $0.15
上下文缓存价格 不可用 不可用
上下文缓存(存储) 不可用 不可用
调优价格 不可用 不可用
依托 Google 搜索进行接地 不可用 不可用
用于改进 Google 产品

Imagen 4

imagen-4.0-generate-001imagen-4.0-ultra-generate-001imagen-4.0-fast-generate-001

在 Google AI Studio 中试用

Google 最新的图像生成模型,文字渲染效果大幅提升,整体图片质量也更为出色。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

免费层级 付费层级(美元/张图片)
Imagen 4 Fast 图片价格 不可用 $0.02
Imagen 4 Standard 图片价格 不可用 $0.04
Imagen 4 Ultra 图片价格 不可用 $0.06
用于改进 Google 产品

Veo 3.1

veo-3.1-generate-previewveo-3.1-fast-generate-previewveo-3.1-lite-generate-preview

试用 Veo 3.1

Google 最新的视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。

预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

免费层级 付费层级(美元/秒)
Veo 3.1 Standard 视频(含音频)价格(默认) 不可用 0.40 美元(720p 和 1080p)
0.60 美元 (4k)
Veo 3.1 Fast 视频(含音频)价格(默认) 不可用 0.10 美元 (720p)
0.12 美元 (1080p)
0.30 美元 (4k)
Veo 3.1 Lite 视频(含音频)价格(默认) 不可用 0.05 美元 (720p)
0.08 美元 (1080p)
(不支持 4k 输出)
用于改进 Google 产品

Veo 3

veo-3.0-generate-001veo-3.0-fast-generate-001

试用 Veo 3

Google 的稳定版视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。

免费层级 付费层级(美元/秒)
Veo 3 Standard 视频(含音频)价格(默认) 不可用 $0.40
Veo 3 Fast 视频(含音频)价格(默认) 不可用 0.10 美元 (720p)
0.12 美元 (1080p)
0.30 美元 (4k)
用于改进 Google 产品

Veo 2

veo-2.0-generate-001

试用 API

Google 的前沿视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。

免费层级 付费层级(美元/秒)
视频价格 不可用 $0.35
用于改进 Google 产品

Lyria 3

lyria-3-clip-previewlyria-3-pro-preview

Google 的音乐创作模型系列。预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。

免费层级 付费层级(美元/次请求)
Lyria 3 Clip 预览版(30 秒) 不可用 0.04 美元/首歌曲
Lyria 3 Pro 预览版(完整歌曲) 不可用 0.08 美元/首歌曲
用于改进 Google 产品

Gemini Embedding 2

gemini-embedding-2

试用 API

Google 的首款多模态嵌入模型,可将文本、图片、视频、音频和 PDF 映射到统一的嵌入空间中。

标准

免费层级 付费层级(美元/100 万个 token)
文本输入价格 免费 $0.20
图片输入价格 免费 0.45 美元(每张图片 0.00012 美元)
音频输入价格 免费 6.50 美元(每秒 0.00016 美元)
视频输入价格 免费 12.00 美元(每帧 0.00079 美元)
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
文本输入价格 不可用 $0.10
图片输入价格 不可用 0.225 美元(每张图片 0.00006 美元)
音频输入价格 不可用 3.25 美元(每秒 0.00008 美元)
视频输入价格 不可用 6.00 美元(每帧 0.000395 美元)
用于改进 Google 产品

Gemini Embedding

gemini-embedding-001

试用 API

Google 的 Gemini Embeddings 模型,专为纯文本应用场景打造,现已面向使用 Gemini API 免费层级和付费层级的开发者开放。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 $0.15
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 $0.075
用于改进 Google 产品

Gemini Robotics-ER 1.6 预览版

gemini-robotics-er-1.6-preview

在 Google AI Studio 中试用

Gemini Robotics-ER(全称为 Gemini Robotics-Embodied Reasoning)是一款思考模型,旨在增强机器人理解物理世界并与之交互的能力。

标准

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 1.00 美元(文本 / 图片 / 视频)
2.00 美元(音频)
输出价格(包括思考 token) 免费 5.00 美元
依托 Google 搜索进行接地 不可用 每月 5,000 条提示(免费,与 Flash 共享此限额),超出后针对基于文本和图片的接地,按每 1,000 次搜索查询 14 美元计费。
用于改进 Google 产品

批量

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 0.50 美元(文本 / 图片 / 视频)
1.00 美元(音频)
输出价格(包括思考 token) 不可用 $2.50
依托 Google 搜索进行接地 不可用 不可用
用于改进 Google 产品

Gemini 2.5 Computer Use 预览版

gemini-2.5-computer-use-preview-10-2025

Google 的 Computer Use 模型,经过优化,专门用于构建可自动执行任务的浏览器控制智能体。

免费层级 付费层级(美元/100 万个 token)
输入价格 不可用 1.25 美元:提示 <= 20 万个 token
2.50 美元:提示 > 20 万个 token
输出价格 不可用 10.00 美元:提示 <= 20 万个 token
15.00 美元:提示 > 20 万个 token
用于改进 Google 产品

Gemma 4

Google 的一款先进的轻量级开放模型,基于 Gemini 模型所用的相同技术构建而成。

免费层级 付费层级(美元/100 万个 token)
输入价格 免费 不可用
输出价格 免费 不可用
上下文缓存价格 免费 不可用
上下文缓存(存储) 免费 不可用
调优价格 不可用 不可用
依托 Google 搜索进行接地 不可用 不可用
用于改进 Google 产品

工具价格

各类工具按自身费率计费,相关费用将计入调用该工具的模型费用中。查看模型页面,了解各模型分别支持哪些工具。

免费层级 付费层级(美元/100 万个 token)
Google 搜索 500 RPD(免费,Flash 和 Flash-Lite 共享此限额)。
不适用于 Pro。
Gemini 2.5 模型:
1,500 RPD(免费,Flash 和 Flash-Lite 共享此限额)。
超出后按每 1,000 条接地提示 35 美元计费

Gemini 3 模型:
每月 5,000 条提示(免费),超出后按每 1,000 次搜索查询 14 美元计费
Google 地图 500 RPD
不适用于 Pro。
1,500 RPD(免费,Flash 和 Flash-Lite 共享此限额)
Pro 提供 10,000 RPD 免费额度。
超出后按每 1,000 条接地提示 25 美元计费
代码执行 免费 代码执行将按照所选模型的标准 token 费率计费。 费用完全取决于工具的使用情况,会话运行时间不会产生任何费用。生成的代码和执行结果在创建时按输出 token 计费;当模型在迭代推理过程中使用它们时,则按输入 token 计费。
网址上下文 免费 根据对应模型的价格,按输入 token 计费。
计算机使用 不可用 请参阅 Gemini 2.5 Computer Use 预览版价格表。
文件搜索 免费 嵌入按 0.15 美元 / 100 万个 token 计费。
检索到的文档 token 根据对应模型的价格,按照常规 token 计费。
自定义工具端点(Gemini 3.1 Pro 预览版) 不可用 Gemini 3.1 Pro 预览版价格相同

智能体价格

智能体使用费根据底层的 token 消耗量和工具使用情况计算。

模型 工具
Gemini Deep Research 智能体 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。 工具使用费按照现有价格结构收取;针对搜索接地(检索到的 token 不计费)与 Url_context / 文件搜索(检索到的 token 计入所有其他工具)仍沿用标准计费区分规则。
Gemini API 中的托管式智能体 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。(请参阅价格详情)。 在预览版期间,环境计算资源(CPU、内存、沙盒执行)不计费。
Antigravity Agent 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。(请参阅价格详情)。 在预览版期间,环境计算资源(CPU、内存、沙盒执行)不计费。

备注

  • 文档 token 计费规则DOCUMENT 模态(例如 PDF)的 token 按照图片 token 费率计费。在 API 响应中,这些 token 会归类在 promptTokensDetails 内的 DOCUMENT 模态下。
  • 在所有可用区域,Google AI Studio 均可免费使用。如需了解详情,请参阅结算常见问题解答
  • 实际价格可能与此处列出的价格以及 Gemini Enterprise Agent Platform 上提供的价格有所不同。如需了解 Gemini Enterprise Agent Platform 的价格详情,请访问 Gemini Enterprise Agent Platform 价格页面
  • 如果您正通过动态检索来优化成本,那么只有当响应中包含至少一个来自网络的接地支持网址时,该请求才会产生“依托 Google 搜索进行接地”的费用。使用 Gemini 始终会产生费用。速率限制可能会随时调整。