Google AI Edge | Google AI for Developers

Google AI Edge Portal: Edge-KI im großen Maßstab benchmarken. Melden Sie sich an, um während der privaten Vorschau Zugriff anzufordern.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

LLMs mit LiteRT-LM auf dem Gerät ausführen

Produktionsreifes Open-Source-Inferenz-Framework für leistungsstarke, plattformübergreifende LLM-Bereitstellungen auf Edge-Geräten.

Übersicht Jetzt starten

Spotlight

Mit der Multi-Token-Vorhersage (Multi-Token Prediction, MTP) lässt sich die On-Device-Inferenz von Gemma 4 noch weiter optimieren. Auf mobilen GPUs ist die Decodierung mehr als doppelt so schnell – ohne Qualitätsverlust.

Blogpost Leitfaden

Warum LiteRT-LM?

Plattformübergreifend

LLMs auf Android-, iOS-, Web- und Desktop-Geräten bereitstellen

Hardwarebeschleunigt

Leistung mit GPU- und NPU-Beschleunigung maximieren

Umfassende GenAI-Funktionen

Unterstützung für gängige LLMs sowie Multimodalität (Vision, Audio) und Tool Use.

Gleich mit dem Erstellen loslegen

Python

Python-APIs mit Hardwarebeschleunigung für Linux, MacOS, Windows und Raspberry Pi.

Python-Leitfaden

Android

Native Android-Apps und JVM-basierte Desktop-Tools.

Android-Leitfaden

iOS

Systemeigene iOS-Swift-APIs (macOS folgt demnächst).

Swift-Leitfaden

Web

JavaScript- und TypeScript-APIs für browserbasierte Web-Apps mit WebGPU-Beschleunigung.

Web Guide

Flutter

Mit dem von der Community verwalteten Paket „flutter_gemma“ plattformübergreifende Flutter-Apps erstellen

Flutter-Leitfaden

C++

plattformübergreifende C++-APIs .

C++-Leitfaden

File Builder

.litertlm-Dateien aus konvertierten LiteRT-Modellen erstellen

Leitfaden für File Builder

Teil der Community werden

LiteRT-LM auf GitHub

Sie können zum Open-Source-Projekt beitragen, Probleme melden und Beispiele ansehen.

Auf GitHub ansehen

Hugging Face

Laden Sie vorkonvertierte Modelle (Gemma, Qwen und mehr) herunter und beteiligen Sie sich an der Diskussion.

In Hugging Face ansehen