Gemma 3n 現已發布,可輸入音訊,並針對日常使用的裝置進行最佳化調整!
瞭解詳情
在行動裝置上部署 Gemma
本文將說明在行動裝置上部署及執行 Gemma 模型的各種方法和工具,包括使用 Google AI Edge Gallery 應用程式和 MediaPipe LLM 推論 API。
如要瞭解如何將微調的 Gemma 模型轉換為 LiteRT 版本,請參閱轉換指南。
Google AI Edge Gallery 應用程式
如要查看 LLM 推論 API 的實際運作情形,並測試 Task Bundle 模型,可以使用 Google AI Edge Gallery 應用程式。這個應用程式提供使用者介面,可與裝置端 LLM 互動,讓您:
- 匯入模型:將自訂
.task
模型載入應用程式。
- 設定參數:調整溫度和 Top-K 等設定。
- 生成文字:輸入提示並查看模型的回覆。
- 測試成效:評估模型速度和準確率。
如需 Google AI Edge Gallery 應用程式的使用詳細指南,包括匯入自有模型的操作說明,請參閱應用程式的說明文件。
您可以使用 MediaPipe LLM 推論 API,在行動裝置上執行 Gemma 模型。LLM 推論 API 可做為大型語言模型的包裝函式,讓您在裝置上執行 Gemma 模型,完成常見的文字生成工作,例如資訊檢索、草擬電子郵件和文件摘要。
LLM Inference API 適用於下列行動平台:
詳情請參閱 MediaPipe LLM 推論說明文件。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-09-11 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["缺少我需要的資訊","missingTheInformationINeed","thumb-down"],["過於複雜/步驟過多","tooComplicatedTooManySteps","thumb-down"],["過時","outOfDate","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["示例/程式碼問題","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-09-11 (世界標準時間)。"],[],[],null,[]]