Google AI Edge | Google AI for Developers

隆重推出 Google AI Edge Portal：大规模对边缘 AI 进行基准测试。注册以在非公开预览期间申请访问权限。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

一款可用于生产用途的开源推理框架，旨在在边缘设备上实现高性能、跨平台的 LLM 部署。

概览开始使用

焦点

利用多令牌预测 (MTP) 功能，大幅提升 Gemma 4 的设备端推理性能。在移动 GPU 上实现超过 2 倍的解码速度，且不会降低画质。

博文指南

在 Android、iOS、Web 和桌面设备上部署 LLM。

利用 GPU 和 NPU 加速功能最大限度地提升性能。

支持热门 LLM，以及多模态（视觉、音频）和工具使用。

在 Linux、MacOS、Windows 和 Raspberry Pi 上使用硬件加速的 Python API。

原生 Android 应用和基于 JVM 的桌面工具。

原生 iOS 和 macOS 集成，提供专门的 Metal 支持（Swift API 即将推出）。

C++ 指南

跨平台 C++ API。

C++ 指南

为开源项目做出贡献、报告问题并查看示例。

下载预转换模型（Gemma、Qwen 等），并加入讨论。

使用 LiteRT-LM 在应用内和更广泛的设备上部署 Gemma 4，实现出色的性能和覆盖面。

使用 LiteRT-LM 在穿戴式设备和基于浏览器的平台上大规模部署语言模型。

了解如何对 FunctionGemma 进行微调，并启用由 LiteRT-LM 工具使用 API 提供支持的函数调用功能。

有关边缘端语言模型的 RAG、多模态和函数调用的最新见解。