Gemma 4 发布,支持文本、音频和图片输入,上下文窗口最长可达 25.6 万个 token!
了解详情
在移动设备上部署 Gemma
本文档概述了在移动设备上部署和运行 Gemma 模型的各种方法和工具,包括使用 Google AI Edge Gallery 应用和 MediaPipe LLM 推理 API。
如需了解如何将微调后的 Gemma 模型转换为 LiteRT 版本,请参阅转换指南。
Google AI Edge Gallery 应用
如需查看 LLM 推理 API 的实际应用并测试您的 Task Bundle 模型,您可以使用 Google AI Edge Gallery 应用。此应用提供了一个用于与设备端 LLM 互动的界面,可让您执行以下操作:
- 导入模型:将自定义
.task 模型加载到应用中。
- 配置参数:调整温度和 Top-k 等设置。
- 生成文本:输入提示并查看模型的回答。
- 测试性能:评估模型的速度和准确率。
如需详细了解如何使用 Google AI Edge Gallery 应用,包括有关导入自有模型的说明,请参阅该应用的文档。
您可以使用 MediaPipe LLM Inference API 在移动设备上运行 Gemma 模型。
LLM 推理 API 可充当大型语言模型的封装容器,让您能够在设备上运行 Gemma 模型,以执行常见的文本到文本生成任务,例如信息检索、电子邮件撰写和文档总结。
LLM 推理 API 可在以下移动平台中使用:
如需了解详情,请参阅 MediaPipe LLM 推理文档。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-09-11。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-09-11。"],[],[]]