Gemma 3
一系列先进的轻量级开放模型,采用与 Gemini 2.0 模型相同的研究成果和技术构建而成

处理复杂任务
借助 Gemma 3 的 128K 令牌上下文窗口,您的应用可以处理和理解大量信息,从而实现更复杂的 AI 功能。

立即进军全球市场
借助 Gemma 3 无与伦比的多语言功能,轻松跨语言沟通。开发面向全球受众群体的应用,支持 140 多种语言。

理解文字和图片
轻松构建可分析图片、文本和视频的应用,为互动式和智能应用开辟新的可能性。
使用全球最佳单加速器模型进行构建


利用 Gemma 推进研究
探索不断扩大的专用 Gemma 模型集合,用于进行高级研究。
直观呈现 Gemma 3 基准
与图表互动,查看 Gemma 3 在一系列 LLM 基准测试中的结果。
MMLU-Pro
MMLU 基准测试用于衡量大语言模型在预训练期间获得的知识广度和问题解决能力。
LiveCodeBench
针对 LeetCode 和 Codeforces 等平台上的实际编程问题评估代码生成功能。
dev
Bird-SQL
测试模型将自然语言问题转换为各种领域的复杂 SQL 查询的能力。
GPQA Diamond
使用由生物学、物理学和化学博士撰写的难题来挑战模型。
SimpleQA
评估模型使用简短短语回答简单事实性问题的能力。
FACTS 基础
根据给定的输入文档,评估 LLM 回答在事实上是否准确且足够详细。
MATH
MATH 用于评估语言模型解决复杂数学应用题的能力,这类题目需要推理、多步骤解题和理解数学概念。
HiddenMath
一组内部保留的竞赛数学题。
val
MMMU
评估在需要大学级知识的各个学科领域中的多模态理解和推理能力。
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
*如需详细了解采用其他方法的效果,请参阅技术报告。阅读技术报告







探索 Gemmaverse
由社区创建的 Gemma 模型和工具构成的庞大生态系统,可为您的创新提供支持和灵感
利用 Google Cloud 赠金加速学术研究
借助 Google Cloud 中的 Gemma 3 模型,推进您的研究工作。立即申请即可获得 Google Cloud 赠金,突破研究的界限,为科学界取得进展做出贡献。