免费开始构建,享受宽裕的额度;待应用准备好投入生产后,可先选用预付费模式,再按需切换为随用随付模式进行扩容。
免费
适用于刚开始使用 Gemini API 的开发者和小型项目。
- check_circle对特定模型的访问权限有限
- check_circle免费输入和输出 token
- check_circleGoogle AI Studio 访问权限
- check_circle内容会用于改进 Google 产品*
付费
适用于需要更高调用量和高级功能的生产级应用。
- check_circle针对生产部署放宽了速率限制
- check_circle可访问上下文缓存
- check_circleBatch API(成本降低 50%)
- check_circle使用 Google 的先进模型
- check_circle内容不会用于改进 Google 产品*
企业
适用于在安全性、支持及合规性方面有自定义需求的大规模部署,由 Gemini Enterprise Agent Platform 提供支持。
- check_circle付费层级的所有功能,以及以下可选功能:
- check_circle专属支持渠道
- check_circle高级安全与合规功能
- check_circle预配吞吐量
- check_circle阶梯折扣(基于用量)
- check_circleMLOps、Model Garden 等
Gemini 3.5 Flash
gemini-3.5-flash
Google 最智能的模型,专为速度而打造,将前沿智能与卓越的搜索和接地能力完美结合。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | $1.50 |
| 输出价格(包括思考 token) | 免费 | 9.00 美元 |
| 上下文缓存价格 | 免费 | 0.15 美元 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | $0.75 |
| 输出价格(包括思考 token) | 不可用 | $4.50 |
| 上下文缓存价格 | 不可用 | 0.075 美元 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | $0.75 |
| 输出价格(包括思考 token) | 不可用 | $4.50 |
| 上下文缓存价格 | 不可用 | 0.08 美元 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | $2.70 |
| 输出价格(包括思考 token) | 免费 | 16.20 美元 |
| 上下文缓存价格 | 免费 | 0.27 美元 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 3.5 实时翻译
gemini-3.5-live-translate-preview
Google 的低延迟实时语音转语音翻译模型,支持 70 多种语言。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 3.50 美元或 0.0053 美元/分钟*(音频) |
| 输出价格(包括思考 token) | 免费 | 21.00 美元或 0.0315 美元/分钟*(音频) |
| 用于改进 Google 产品 | 是 | 否 |
* 费用根据音频输入和输出 token 的总消耗量计算,换算标准为每秒音频 25 个 token,相当于每分钟的有效价格约为 0.0368 美元。
Gemini 3.1 Flash-Lite
gemini-3.1-flash-lite
Google 最具成本效益的模型,针对高调用量智能体任务、翻译和简单的数据处理进行了优化。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.25 美元(文本 / 图片 / 视频) 0.50 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $1.50 |
| 上下文缓存价格 | 不可用 | 0.025 美元(文本/图片/视频) 0.05 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.125 美元(文本 / 图片 / 视频) 0.25 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $0.75 |
| 上下文缓存价格 | 不可用 | 0.0125 美元(文本/图片/视频) 0.025 美元(音频) 0.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.125 美元(文本 / 图片 / 视频) 0.25 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $0.75 |
| 上下文缓存价格 | 不可用 | 0.0125 美元(文本/图片/视频) 0.025 美元(音频) 0.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.45 美元(文本 / 图片 / 视频) 0.90 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $2.70 |
| 上下文缓存价格 | 不可用 | 0.045 美元(文本/图片/视频) 0.09 美元(音频) 1.80 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 3 Pro 预览版
gemini-3.1-pro-preview 和 gemini-3.1-pro-preview-customtools
针对全球领先的多模态理解、智能体功能和氛围编程 (vibe coding) 模型系列,在性能、智能和易用性方面进行了全新升级。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 2.00 美元:提示 <= 20 万个 token 4.00 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 12.00 美元:提示 <= 20 万个 token 18.00 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.20 美元:提示 <= 20 万个 token 0.40 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.00 美元:提示 <= 20 万个 token 2.00 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 6.00 美元:提示 <= 20 万个 token 9.00 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 与标准层级相同 0.20 美元:提示 <= 20 万个 token 0.40 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.00 美元:提示 <= 20 万个 token 2.00 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 6.00 美元:提示 <= 20 万个 token 9.00 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 与标准层级相同 0.20 美元:提示 <= 20 万个 token 0.40 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 3.60 美元:提示 <= 20 万个 token 7.20 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 21.60 美元:提示 <= 20 万个 token 32.40 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.36 美元:提示 <= 20 万个 token 0.72 美元:提示 > 20 万个 token 8.10 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 3.1 Flash Live 预览版
gemini-3.1-flash-live-preview
Google 的低延迟音频转音频模型,针对实时对话场景进行了优化,具备声学细微差别检测、数值精准处理及多模态感知能力。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.75 美元(文本) 3.00 美元或 0.005 美元/分钟(音频) 1.00 美元或 0.002 美元/分钟(图片/视频) |
| 输出价格(包括思考 token) | 免费 | 4.50 美元(文本) 12.00 美元或 0.018 美元/分钟(音频) |
| 依托 Google 搜索进行接地* | 支持 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 3.1 Flash Image 🍌
gemini-3.1-flash-image
Gemini 3.1 Flash 图片生成模型专为速度和效率而打造,非常适合快速交互式响应和高吞吐量场景。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.50 美元(文本/图片) |
| 输出价格 | 不可用 | 3 美元(文本和思考) 60.00 美元(图片) 相当于每张 0.5K 图片 0.045 美元* 每张 1K 图片 0.067 美元*、 每张 2K 图片 0.101 美元*, 以及每张 4K 图片 0.151 美元*。 |
| 依托 Google 搜索进行接地** | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后针对基于文本和图片的接地,按每 1,000 次搜索查询 14 美元计费。 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.25 美元(文本、图片) |
| 输出价格 | 不可用 | 1.50 美元(文本和思考) 30.00 美元(图片) 相当于每张 0.5K 图片 0.022 美元* 每张 1K 图片 0.034 美元*、 每张 2K 图片 0.050 美元*, 以及每张 4K 图片 0.076 美元*。 |
| 用于改进 Google 产品 | 是 | 否 |
* 图片输出的价格为 60 美元/100 万个 token。分辨率为 0.5K (512px) 的输出图片会消耗 747 个 token,相当于每张图片 0.045 美元。分辨率为 1K (1024x1024px) 的输出图片会消耗 1120 个 token,相当于每张图片 0.067 美元。分辨率为 2K (2048x2048px) 的输出图片会消耗 1680 个 token,相当于每张图片 0.101 美元。分辨率为 4K (4096x4096px) 的输出图片会消耗 2520 个 token,相当于每张图片 0.151 美元。
** 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。通过“依托 Google 搜索进行接地”功能检索到的上下文(文本或图片)不计入输入 token 费用。
Gemini 3.1 Flash TTS 预览版
gemini-3.1-flash-tts-preview
Google 的 3.1 Flash 文字转语音音频模型,经过优化,可实现高性价比、低延迟且可控的语音生成。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 1.00 美元(文本) |
| 输出价格 | 免费 | 20.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.50 美元(文本) |
| 输出价格 | 不可用 | 10.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
* 音频 token 的换算标准为每秒音频 25 个 token。
Gemini 3 Flash 预览版
gemini-3-flash-preview
Google 最智能的模型,专为速度而打造,将前沿智能与卓越的搜索和接地能力完美结合。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.50 美元(文本 / 图片 / 视频) 1.00 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $3.00 |
| 上下文缓存价格 | 免费 | 0.05 美元(文本/图片/视频) 0.10 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.25 美元(文本 / 图片 / 视频) 0.50 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $1.50 |
| 上下文缓存价格 | 不可用 | 与标准层级相同 0.05 美元(文本/图片/视频) 0.10 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.25 美元(文本 / 图片 / 视频) 0.50 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $1.50 |
| 上下文缓存价格 | 不可用 | 与标准层级相同 0.05 美元(文本/图片/视频) 0.10 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 个请求(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.90 美元(文本 / 图片 / 视频) 1.80 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $5.40 |
| 上下文缓存价格 | 免费 | 0.09 美元(文本/图片/视频) 0.18 美元(音频) 1.80 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地* | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 3 Pro Image 🍌
gemini-3-pro-image
Google 的原生图片生成模型,针对速度、灵活性和上下文理解进行了优化。文本输入和输出的价格与 Gemini 3.1 Pro 相同。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 2.00 美元(文本/图片), 相当于每张图片 0.0011 美元* |
| 输出价格 | 不可用 | 12.00 美元(文本和思考) 120.00 美元(图片) 相当于每张 1K/2K 图片 0.134 美元** 每张 4K 图片 0.24 美元** |
| 依托 Google 网页搜索和图片搜索进行接地*** | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.00 美元(文本), 0.0006 美元(图片)* |
| 输出价格 | 不可用 | 6.00 美元(文本和思考) 每张 1K/2K 图片 0.067 美元** 每张 4K 图片 0.12 美元** |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.00 美元(文本), 0.0006 美元(图片)* |
| 输出价格 | 不可用 | 6.00 美元(文本和思考) 每张 1K/2K 图片 0.067 美元** 每张 4K 图片 0.12 美元** |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 3.60 美元(文本/图片) |
| 输出价格 | 不可用 | 21.60 美元(文本和思考) 216.00 美元(图片) |
| 依托 Google 网页搜索和图片搜索进行接地*** | 不可用 | 每月 5,000 条提示(免费,在 Gemini 3 中共享),超出后按每 1,000 次搜索查询 14 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
* 图片输入计费标准为每张图片 560 个 token 或 0.0011 美元。
**图片输出的价格为 120 美元/100 万个 token。分辨率介于 1024x1024px (1K) 到 2048x2048px (2K) 之间的输出图片会消耗 1120 个 token,相当于每张图片 0.134 美元。分辨率最高为 4096x4096px (4K) 的输出图片会消耗 2000 个 token,相当于每张图片 0.24 美元。
*** 客户向 Gemini 提交的请求可能会触发一次或多次 Google 搜索查询。每执行一次搜索查询,系统都会单独收取费用。
Gemini 2.5 Pro
gemini-2.5-pro
Google 的前沿多用途模型,在编程和复杂推理任务方面表现卓越。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 1.25 美元:提示 <= 20 万个 token 2.50 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 免费 | 10.00 美元:提示 <= 20 万个 token 15.00 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.125 美元:提示 <= 20 万个 token 0.25 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 10,000 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.625 美元:提示 <= 20 万个 token 1.25 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 5.00 美元:提示 <= 20 万个 token 7.50 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.125 美元:提示 <= 20 万个 token 0.25 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.625 美元:提示 <= 20 万个 token 1.25 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 不可用 | 5.00 美元:提示 <= 20 万个 token 7.50 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.125 美元:提示 <= 20 万个 token 0.25 美元:提示 > 20 万个 token 4.50 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 2.25 美元:提示 <= 20 万个 token 4.50 美元:提示 > 20 万个 token |
| 输出价格(包括思考 token) | 免费 | 18.00 美元:提示 <= 20 万个 token 27.00 美元:提示 > 20 万个 token |
| 上下文缓存价格 | 不可用 | 0.225 美元:提示 <= 20 万个 token 0.45 美元:提示 > 20 万个 token 8.10 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 10,000 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Flash
gemini-2.5-flash
Google 首款混合推理模型,支持 100 万 token 的上下文窗口,并配备了思考预算功能。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.30 美元(文本 / 图片 / 视频) 1.00 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $2.50 |
| 上下文缓存价格 | 不可用 | 0.03 美元(文本/图片/视频) 0.1 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD(与 Flash-Lite RPD 共享此限额) | 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.15 美元(文本 / 图片 / 视频) 0.50 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $1.25 |
| 上下文缓存价格 | 不可用 | 0.03 美元(文本/图片/视频) 0.1 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.15 美元(文本 / 图片 / 视频) 0.50 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $1.25 |
| 上下文缓存价格 | 不可用 | 0.03 美元(文本/图片/视频) 0.1 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.54 美元(文本 / 图片 / 视频) 1.80 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $4.50 |
| 上下文缓存价格 | 不可用 | 0.054 美元(文本/图片/视频) 0.18 美元(音频) 1.80 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD(与 Flash-Lite RPD 共享此限额) | 1,500 RPD(免费,与 Flash-Lite RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Google 体积最小、性价比最高的模型,专为大规模应用场景而打造。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 免费 | 0.10 美元(文本 / 图片 / 视频) 0.30 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $0.40 |
| 上下文缓存价格 | 不可用 | 0.01 美元(文本/图片/视频) 0.03 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD(与 Flash RPD 共享此限额) | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 不可用 | 0.05 美元(文本 / 图片 / 视频) 0.15 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $0.20 |
| 上下文缓存价格 | 不可用 | 0.01 美元(文本/图片/视频) 0.03 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 不可用 | 0.05 美元(文本 / 图片 / 视频) 0.15 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $0.20 |
| 上下文缓存价格 | 不可用 | 0.01 美元(文本/图片/视频) 0.03 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 免费 | 0.18 美元(文本 / 图片 / 视频) 0.54 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $0.72 |
| 上下文缓存价格 | 不可用 | 0.018 美元(文本/图片/视频) 0.054 美元(音频) 1.80 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD(与 Flash RPD 共享此限额) | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Flash-Lite 预览版
gemini-2.5-flash-lite-preview-09-2025
基于 Gemini 2.5 Flash Lite 打造的全新模型,专为极致性价比、高吞吐量和卓越品质而优化。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 免费 | 0.10 美元(文本 / 图片 / 视频) 0.30 美元(音频) |
| 输出价格(包括思考 token) | 免费 | $0.40 |
| 上下文缓存价格 | 不可用 | 0.01 美元(文本/图片/视频) 0.03 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD(与 Flash RPD 共享此限额) | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格(文字、图片、视频) | 不可用 | 0.05 美元(文本 / 图片 / 视频) 0.15 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $0.20 |
| 上下文缓存价格 | 不可用 | 0.01 美元(文本/图片/视频) 0.03 美元(音频) 1.00 美元/100 万个 token/小时(存储价格) |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费,与 Flash RPD 共享此限额),超出后按每 1,000 条接地提示 35 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Flash Native Audio (Live API)
gemini-2.5-flash-native-audio-preview-12-2025
Google 的 Live API 原生音频模型,经过优化,可输出更高质量的音频,在语速节奏、语音自然度、表达丰富度及情绪表现力上均有提升。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.50 美元(文本) 3.00 美元(音频 / 视频) |
| 输出价格(包括思考 token) | 免费 | 2.00 美元(文本) 12.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Flash Image 🍌
gemini-2.5-flash-image
Google 的原生图片生成模型,针对速度、灵活性和上下文理解进行了优化。文本输入和输出的价格与 2.5 Flash 相同。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.30 美元(文本 / 图片) |
| 输出价格 | 不可用 | 0.039 美元/张图片* |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.15 美元(文本 / 图片) |
| 输出价格 | 不可用 | 0.0195 美元/张图片* |
| 用于改进 Google 产品 | 是 | 否 |
Flex
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.15 美元(文本 / 图片) |
| 输出价格 | 不可用 | 0.0195 美元/张图片* |
| 用于改进 Google 产品 | 是 | 否 |
优先级
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.54 美元(文本 / 图片) |
| 输出价格 | 不可用 | 每张图片 0.0702 美元* |
| 用于改进 Google 产品 | 是 | 否 |
[*] 图片输出的价格为 30 美元/100 万个 token。分辨率最高为 1024x1024px 的输出图片会消耗 1290 个 token,相当于每张图片 0.039 美元。
Gemini 2.5 Flash 预览版 TTS
gemini-2.5-flash-preview-tts
Google 的 2.5 Flash 文字转语音音频模型,经过优化,可实现高性价比、低延迟、可控的语音生成。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.50 美元(文本) |
| 输出价格 | 免费 | 10.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.25 美元(文本) |
| 输出价格 | 不可用 | 5.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Pro 预览版 TTS
gemini-2.5-pro-preview-tts
Google 的 2.5 Pro 文字转语音音频模型,经过优化,具备强大的低延迟语音生成能力,语音输出更自然,提示引导也更易实现。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.00 美元(文本) |
| 输出价格 | 不可用 | 20.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.50 美元(文本) |
| 输出价格 | 不可用 | 10.00 美元(音频) |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.0 Flash
gemini-2.0-flash
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 0.10 美元(文本 / 图片 / 视频) 0.70 美元(音频) |
| 输出价格 | 免费 | $0.40 |
| 上下文缓存价格 | 免费 | 0.025 美元 / 100 万个 token(文本/图片/视频) 0.175 美元 / 100 万个 token(音频) |
| 上下文缓存(存储) | 不可用 | 1.00 美元/100 万个 token/小时 |
| 图片生成价格 | 不适用(已关停) | 不适用(已关停) |
| 调优价格 | 不可用 | 不可用 |
| 依托 Google 搜索进行接地 | 免费,最多 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 500 RPD | 1,500 RPD(免费),超出后按每 1,000 条接地提示 25 美元计费 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.05 美元(文本 / 图片 / 视频) 0.35 美元(音频) |
| 输出价格 | 不可用 | $0.20 |
| 上下文缓存价格 | 不可用 | 0.025 美元 / 100 万个 token(文本/图片/视频) 0.175 美元 / 100 万个 token(音频) |
| 上下文缓存(存储) | 不可用 | 1.00 美元/100 万个 token/小时 |
| 图片生成价格 | 不适用(已关停) | 不适用(已关停) |
| 调优价格 | 不可用 | 不可用 |
| 依托 Google 搜索进行接地 | 不可用 | 1,500 RPD(免费),超出后按每 1,000 条接地提示 35 美元计费 |
| 依托 Google 地图进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
[*] 图片输出的价格为 30 美元/100 万个 token。分辨率最高为 1024x1024px 的输出图片会消耗 1290 个 token,相当于每张图片 0.039 美元。
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | $0.075 |
| 输出价格 | 免费 | $0.30 |
| 上下文缓存价格 | 不可用 | 不可用 |
| 上下文缓存(存储) | 不可用 | 不可用 |
| 调优价格 | 不可用 | 不可用 |
| 依托 Google 搜索进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | $0.0375 |
| 输出价格 | 不可用 | $0.15 |
| 上下文缓存价格 | 不可用 | 不可用 |
| 上下文缓存(存储) | 不可用 | 不可用 |
| 调优价格 | 不可用 | 不可用 |
| 依托 Google 搜索进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
Imagen 4
imagen-4.0-generate-001、imagen-4.0-ultra-generate-001、imagen-4.0-fast-generate-001
Google 最新的图像生成模型,文字渲染效果大幅提升,整体图片质量也更为出色。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
| 免费层级 | 付费层级(美元/张图片) | |
|---|---|---|
| Imagen 4 Fast 图片价格 | 不可用 | $0.02 |
| Imagen 4 Standard 图片价格 | 不可用 | $0.04 |
| Imagen 4 Ultra 图片价格 | 不可用 | $0.06 |
| 用于改进 Google 产品 | 是 | 否 |
Veo 3.1
veo-3.1-generate-preview、veo-3.1-fast-generate-preview、veo-3.1-lite-generate-preview
Google 最新的视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。
预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
| 免费层级 | 付费层级(美元/秒) | |
|---|---|---|
| Veo 3.1 Standard 视频(含音频)价格(默认) | 不可用 | 0.40 美元(720p 和 1080p) 0.60 美元 (4k) |
| Veo 3.1 Fast 视频(含音频)价格(默认) | 不可用 | 0.10 美元 (720p) 0.12 美元 (1080p) 0.30 美元 (4k) |
| Veo 3.1 Lite 视频(含音频)价格(默认) | 不可用 | 0.05 美元 (720p) 0.08 美元 (1080p) (不支持 4k 输出) |
| 用于改进 Google 产品 | 是 | 否 |
Veo 3
veo-3.0-generate-001,veo-3.0-fast-generate-001
Google 的稳定版视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。
| 免费层级 | 付费层级(美元/秒) | |
|---|---|---|
| Veo 3 Standard 视频(含音频)价格(默认) | 不可用 | $0.40 |
| Veo 3 Fast 视频(含音频)价格(默认) | 不可用 | 0.10 美元 (720p) 0.12 美元 (1080p) 0.30 美元 (4k) |
| 用于改进 Google 产品 | 是 | 否 |
Veo 2
veo-2.0-generate-001
Google 的前沿视频生成模型,现已面向使用 Gemini API 付费层级的开发者开放。
| 免费层级 | 付费层级(美元/秒) | |
|---|---|---|
| 视频价格 | 不可用 | $0.35 |
| 用于改进 Google 产品 | 是 | 否 |
Lyria 3
lyria-3-clip-preview 和 lyria-3-pro-preview
Google 的音乐创作模型系列。预览版模型在转为稳定版之前可能会发生变化,且速率限制会更为严格。
| 免费层级 | 付费层级(美元/次请求) | |
|---|---|---|
| Lyria 3 Clip 预览版(30 秒) | 不可用 | 0.04 美元/首歌曲 |
| Lyria 3 Pro 预览版(完整歌曲) | 不可用 | 0.08 美元/首歌曲 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini Embedding 2
gemini-embedding-2
Google 的首款多模态嵌入模型,可将文本、图片、视频、音频和 PDF 映射到统一的嵌入空间中。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 文本输入价格 | 免费 | $0.20 |
| 图片输入价格 | 免费 | 0.45 美元(每张图片 0.00012 美元) |
| 音频输入价格 | 免费 | 6.50 美元(每秒 0.00016 美元) |
| 视频输入价格 | 免费 | 12.00 美元(每帧 0.00079 美元) |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 文本输入价格 | 不可用 | $0.10 |
| 图片输入价格 | 不可用 | 0.225 美元(每张图片 0.00006 美元) |
| 音频输入价格 | 不可用 | 3.25 美元(每秒 0.00008 美元) |
| 视频输入价格 | 不可用 | 6.00 美元(每帧 0.000395 美元) |
| 用于改进 Google 产品 | 是 | 否 |
Gemini Embedding
gemini-embedding-001
Google 的 Gemini Embeddings 模型,专为纯文本应用场景打造,现已面向使用 Gemini API 免费层级和付费层级的开发者开放。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | $0.15 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | $0.075 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini Robotics-ER 1.6 预览版
gemini-robotics-er-1.6-preview
Gemini Robotics-ER(全称为 Gemini Robotics-Embodied Reasoning)是一款思考模型,旨在增强机器人理解物理世界并与之交互的能力。
标准
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 1.00 美元(文本 / 图片 / 视频) 2.00 美元(音频) |
| 输出价格(包括思考 token) | 免费 | 5.00 美元 |
| 依托 Google 搜索进行接地 | 不可用 | 每月 5,000 条提示(免费,与 Flash 共享此限额),超出后针对基于文本和图片的接地,按每 1,000 次搜索查询 14 美元计费。 |
| 用于改进 Google 产品 | 是 | 否 |
批量
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 0.50 美元(文本 / 图片 / 视频) 1.00 美元(音频) |
| 输出价格(包括思考 token) | 不可用 | $2.50 |
| 依托 Google 搜索进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
Gemini 2.5 Computer Use 预览版
gemini-2.5-computer-use-preview-10-2025
Google 的 Computer Use 模型,经过优化,专门用于构建可自动执行任务的浏览器控制智能体。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 不可用 | 1.25 美元:提示 <= 20 万个 token 2.50 美元:提示 > 20 万个 token |
| 输出价格 | 不可用 | 10.00 美元:提示 <= 20 万个 token 15.00 美元:提示 > 20 万个 token |
| 用于改进 Google 产品 | 是 | 否 |
Gemma 4
Google 的一款先进的轻量级开放模型,基于 Gemini 模型所用的相同技术构建而成。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| 输入价格 | 免费 | 不可用 |
| 输出价格 | 免费 | 不可用 |
| 上下文缓存价格 | 免费 | 不可用 |
| 上下文缓存(存储) | 免费 | 不可用 |
| 调优价格 | 不可用 | 不可用 |
| 依托 Google 搜索进行接地 | 不可用 | 不可用 |
| 用于改进 Google 产品 | 是 | 否 |
工具价格
各类工具按自身费率计费,相关费用将计入调用该工具的模型费用中。查看模型页面,了解各模型分别支持哪些工具。
| 免费层级 | 付费层级(美元/100 万个 token) | |
|---|---|---|
| Google 搜索 | 500 RPD(免费,Flash 和 Flash-Lite 共享此限额)。 不适用于 Pro。 |
Gemini 2.5 模型: 1,500 RPD(免费,Flash 和 Flash-Lite 共享此限额)。 超出后按每 1,000 条接地提示 35 美元计费 Gemini 3 模型: 每月 5,000 条提示(免费),超出后按每 1,000 次搜索查询 14 美元计费 |
| Google 地图 | 500 RPD 不适用于 Pro。 |
1,500 RPD(免费,Flash 和 Flash-Lite 共享此限额) Pro 提供 10,000 RPD 免费额度。 超出后按每 1,000 条接地提示 25 美元计费 |
| 代码执行 | 免费 | 代码执行将按照所选模型的标准 token 费率计费。 费用完全取决于工具的使用情况,会话运行时间不会产生任何费用。生成的代码和执行结果在创建时按输出 token 计费;当模型在迭代推理过程中使用它们时,则按输入 token 计费。 |
| 网址上下文 | 免费 | 根据对应模型的价格,按输入 token 计费。 |
| 计算机使用 | 不可用 | 请参阅 Gemini 2.5 Computer Use 预览版价格表。 |
| 文件搜索 | 免费 | 嵌入按 0.15 美元 / 100 万个 token 计费。 检索到的文档 token 根据对应模型的价格,按照常规 token 计费。 |
| 自定义工具端点(Gemini 3.1 Pro 预览版) | 不可用 | 与 Gemini 3.1 Pro 预览版价格相同 |
智能体价格
智能体使用费根据底层的 token 消耗量和工具使用情况计算。
| 模型 | 工具 | |
|---|---|---|
| Gemini Deep Research 智能体 | 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。 | 工具使用费按照现有价格结构收取;针对搜索接地(检索到的 token 不计费)与 Url_context / 文件搜索(检索到的 token 计入所有其他工具)仍沿用标准计费区分规则。 |
| Gemini API 中的托管式智能体 | 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。(请参阅价格详情)。 | 在预览版期间,环境计算资源(CPU、内存、沙盒执行)不计费。 |
| Antigravity Agent | 所有模型推理均按 Gemini 标准价格表费率计费,包括在智能体循环期间生成的输入、输出以及中间输入 / 推理 token。(请参阅价格详情)。 | 在预览版期间,环境计算资源(CPU、内存、沙盒执行)不计费。 |
备注
- 文档 token 计费规则:
DOCUMENT模态(例如 PDF)的 token 按照图片 token 费率计费。在 API 响应中,这些 token 会归类在promptTokensDetails内的DOCUMENT模态下。 - 在所有可用区域,Google AI Studio 均可免费使用。如需了解详情,请参阅结算常见问题解答。
- 实际价格可能与此处列出的价格以及 Gemini Enterprise Agent Platform 上提供的价格有所不同。如需了解 Gemini Enterprise Agent Platform 的价格详情,请访问 Gemini Enterprise Agent Platform 价格页面。
- 如果您正通过动态检索来优化成本,那么只有当响应中包含至少一个来自网络的接地支持网址时,该请求才会产生“依托 Google 搜索进行接地”的费用。使用 Gemini 始终会产生费用。速率限制可能会随时调整。