Gemma 4 推出,支援文字、音訊和圖片輸入,脈絡窗口最長可達 25.6 萬個詞元!
瞭解詳情
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
提供意見
使用 Llama.cpp 執行 Gemma
llama.cpp 是熱門的開放原始碼程式庫,專為高效能的本機推論設計。
快速入門
安裝
llama.cpp 的預先建構版本
範例指令:
# Download and run a model directly from Hugging Face
llama-cli -hf ggml-org/gemma-4-E2B-it-GGUF --prompt "Write a poem about the Kraken."
# Use System Prompt
llama-cli -hf ggml-org/gemma-4-E2B-it-GGUF -sys "You are Hong Gildong." -p "Who are you?"
如要開始使用並在美觀的介面中執行模型,可以啟動伺服器:
llama-server -hf ggml-org/gemma-4-E2B-it-GGUF
這會建立伺服器,讓您透過介面 (http://localhost:8080) 或存取 OpenAI 端點 (http://localhost:8080/v1) 來存取模型。
如要進一步瞭解如何搭配 Gemma 使用 llama.cpp,請參閱官方存放區:
GitHub 上的 llama.cpp
提供意見
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權 ,程式碼範例則為阿帕契 2.0 授權 。詳情請參閱《Google Developers 網站政策 》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2026-04-17 (世界標準時間)。
想進一步說明嗎?
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["缺少我需要的資訊","missingTheInformationINeed","thumb-down"],["過於複雜/步驟過多","tooComplicatedTooManySteps","thumb-down"],["過時","outOfDate","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["示例/程式碼問題","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2026-04-17 (世界標準時間)。"],[],[]]