Google AI Edge Portal 隆重推出：大規模基準測試 Edge AI。申請在非公開預先發布版期間要求存取權。

使用 LiteRT 部署生成式 AI 模型

LiteRT 可在行動裝置、桌機和網頁平台，以高效能部署生成式 AI 模型。LiteRT 可順暢運用 CPU、GPU 和 NPU 的硬體加速功能，為裝置端生成式 AI 推論提供最先進的效能。

您可以使用下列整合式技術堆疊，部署複雜的生成式 AI 模型：

Torch Generative API：LiteRT Torch 程式庫中的 Python 模組，用於製作及轉換 PyTorch GenAI 模型。並提供最佳化建構區塊，確保裝置上的執行效能。詳情請參閱「轉換 PyTorch GenAI 模型」。
LiteRT-LM：以 LiteRT 為基礎建構的專用自動化調度管理層，可管理 LLM 特有的複雜性，例如工作階段複製、kv 快取管理、提示快取/評分、具狀態的推論。詳情請參閱 LiteRT-LM GitHub 存放區。
LiteRT 轉換器和執行階段：基礎引擎，可提供高效的模型轉換、執行階段執行和最佳化功能，在 CPU、GPU 和 NPU 中實現進階硬體加速。

LiteRT GenAI 模型庫

LiteRT 支援 LiteRT Hugging Face 社群中越來越多熱門的開放權重模型。這些模型經過預先轉換及調整，可立即部署，讓您直接在 CPU、GPU 和 NPU 上發揮最高效能。

Gemma 系列
- Gemma 3 270M
- Gemma 3 1B
- Gemma 3n E2B/E4B
- EmbeddingGemma 300M：請參閱 EmbeddingGemma 語意相似度 LiteRT C++ 應用程式
- Gemma 270M 的功能
Qwen 系列
Llama
Phi
SmoLM
FastVLM

精選深入分析

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2026-01-28 (世界標準時間)。