Khung suy luận nguồn mở, sẵn sàng cho hoạt động sản xuất, được thiết kế để cung cấp các hoạt động triển khai LLM hiệu suất cao, đa nền tảng trên các thiết bị biên

Tại sao nên dùng LiteRT-LM?

Triển khai LLM trên Android, iOS, Web và máy tính.
Tối đa hoá hiệu suất bằng tính năng tăng tốc GPU và NPU.
Hỗ trợ các LLM phổ biến cũng như đa phương thức (Thị giác, Âm thanh) và Sử dụng công cụ.
Chạy các mô hình nguồn mở mới nhất được tối ưu hoá cho thiết bị biên, bao gồm Gemma-3n, Gemma-3, FunctionGemma, TranslateGemma, Qwen3, Phi-4 và nhiều mô hình khác.

Bắt đầu xây dựng

Ứng dụng Android gốc và các công cụ dành cho máy tính dựa trên JVM.
Tích hợp iOS và macOS gốc với chế độ hỗ trợ Metal chuyên biệt (sắp có API Swift).
Chạy trực tiếp trong trình duyệt bằng WebAssembly và WebGPU (API JS sẽ ra mắt trong thời gian tới).

Tham gia cộng đồng

Đóng góp vào mã nguồn, báo cáo vấn đề và xem ví dụ.
Tải các mô hình đã chuyển đổi trước xuống và tham gia thảo luận.