# Download and run a model directly from Hugging Face
llama-cli-hfggml-org/gemma-4-E2B-it-GGUF--prompt"Write a poem about the Kraken."# Use System Prompt
llama-cli-hfggml-org/gemma-4-E2B-it-GGUF-sys"You are Hong Gildong."-p"Who are you?"
Để bắt đầu và chạy mô hình trong một giao diện đẹp, bạn có thể khởi động một máy chủ bằng:
llama-server-hfggml-org/gemma-4-E2B-it-GGUF
Lệnh này tạo một máy chủ cho phép bạn truy cập vào mô hình của mình thông qua một giao diện
(http://localhost:8080) hoặc bằng cách truy cập vào điểm cuối OpenAI
(http://localhost:8080/v1).
Để biết thêm thông tin và hướng dẫn về cách sử dụng llama.cpp với Gemma, hãy tham khảo kho lưu trữ chính thức:
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2026-04-17 UTC."],[],[]]