Google AI Edge | Google AI for Developers

Przedstawiamy Google AI Edge Portal: benchmark Edge AI na dużą skalę. Zarejestruj się, aby poprosić o dostęp podczas wersji prywatnej.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Uruchamianie LLM na urządzeniu za pomocą LiteRT-LM

Gotowa do wykorzystania w środowisku produkcyjnym platforma wnioskowania typu open source zaprojektowana z myślą o wdrażaniu na urządzeniach brzegowych dużych modeli językowych (LLM) o wysokiej wydajności i działających na wielu platformach.

Przegląd Rozpocznij

Wyróżnione

Zwiększ wydajność wnioskowania na urządzeniu w przypadku modelu Gemma 4 dzięki funkcji przewidywania wielu tokenów (MTP). Dekodowanie na mobilnych układach GPU jest ponad 2 razy szybsze bez utraty jakości.

Post na blogu Przewodnik

Dlaczego LiteRT-LM?

Na wielu platformach

wdrażać duże modele językowe na urządzeniach z Androidem, iOS, w internecie i na komputerach;

Akceleracja sprzętowa

Maksymalizacja wydajności dzięki akceleracji GPU i NPU.

Szerokie możliwości generatywnej AI

Obsługa popularnych dużych modeli językowych, a także multimodalności (wizja, dźwięk) i korzystania z narzędzi.

Zacznij tworzyć

Python

Interfejsy API Pythona z akceleracją sprzętową w systemach Linux, macOS, Windows i Raspberry Pi.

Przewodnik Pythona

Android

Natywne aplikacje na Androida i narzędzia na komputery oparte na JVM.

Przewodnik po Androidzie

iOS

Natywna integracja z iOS i macOS ze specjalistyczną obsługą Metal (interfejsy API Swift będą dostępne wkrótce).

Przewodnik po C++

C++

Interfejsy API C++ na różne platformy .

Przewodnik po C++

Dołącz do społeczności

LiteRT-LM w GitHubie

Współpracuj przy projekcie open source, zgłaszaj problemy i zapoznaj się z przykładami.

Wyświetl w GitHubie

Hugging Face

Pobierz wstępnie przekonwertowane modele (Gemma, Qwen i inne) i dołącz do dyskusji.

Wyświetl w Hugging Face

Blogi i ogłoszenia

Zapewnij najnowocześniejsze funkcje agentowe na urządzeniach brzegowych dzięki modelowi Gemma 4.

Wdrażaj model Gemma 4 w aplikacjach i na szerszej gamie urządzeń, korzystając z LiteRT-LM, aby uzyskać doskonałą wydajność i zasięg.

Generatywna AI na urządzeniu w Chrome, Chromebooku Plus i Pixel Watch

Wdrażaj modele językowe na urządzeniach do noszenia i platformach przeglądarkowych na dużą skalę za pomocą LiteRT-LM.

Wywoływanie funkcji na urządzeniu w aplikacji Galeria AI Edge od Google

Dowiedz się, jak dostroić model FunctionGemma i włączyć funkcje wywoływania funkcji oparte na interfejsach LiteRT-LM Tool Use API.

Małe modele językowe, multimodalność i wywoływanie funkcji w AI Edge od Google

Najnowsze informacje o RAG, multimodalności i wywoływaniu funkcji w przypadku modeli językowych na urządzeniach brzegowych.

O ile nie stwierdzono inaczej, treść tej strony jest objęta licencją Creative Commons – uznanie autorstwa 4.0, a fragmenty kodu są dostępne na licencji Apache 2.0. Szczegółowe informacje na ten temat zawierają zasady dotyczące witryny Google Developers. Java jest zastrzeżonym znakiem towarowym firmy Oracle i jej podmiotów stowarzyszonych.

Ostatnia aktualizacja: 2026-05-05 UTC.