Eseguire LLM sul dispositivo con LiteRT-LM
Framework di inferenza open source pronto per la produzione progettato per fornire implementazioni LLM multipiattaforma ad alte prestazioni su dispositivi edge.
Perché LiteRT-LM?
Piattaforma multipla
Implementa i LLM su Android, iOS, web e computer.
Accelerato hardware
Massimizza le prestazioni con l'accelerazione di GPU e NPU.
Ampie funzionalità di AI generativa
Supporto per LLM popolari, nonché per la multimodalità (visione, audio) e l'utilizzo di strumenti.
Inizia a creare
Python
API Python con accelerazione hardware su Linux, macOS, Windows e Raspberry Pi.
Android
App Android native e strumenti desktop basati su JVM.
iOS
API Swift native per iOS (macOS disponibile a breve).
Web
API JavaScript e TypeScript per app web basate su browser con accelerazione WebGPU.
Flutter
Crea app Flutter multipiattaforma utilizzando il pacchetto flutter_gemma gestito dalla community.
C++
API C++ multipiattaforma .
File Builder
Crea file .litertlm dai modelli LiteRT convertiti.
Unisciti alla Community
LiteRT-LM su GitHub
Contribuisci al progetto open source, segnala problemi e visualizza esempi.
Hugging Face
Scarica modelli pre-convertiti (Gemma, Qwen e altri) e partecipa alla discussione.
Blog e annunci
Migliorare l'inferenza on-device di Gemma 4 con la previsione multi-token (MTP)
Sperimenta velocità di decodifica più che doppie sulle GPU mobile senza alcuna perdita di qualità.
Porta competenze agentiche all'avanguardia all'edge con Gemma 4.
Esegui il deployment di Gemma 4 in-app e su una gamma più ampia di dispositivi con prestazioni e copertura eccezionali utilizzando LiteRT-LM.
GenAI on-device in Chrome, Chromebook Plus e Pixel Watch
Esegui il deployment di modelli linguistici su dispositivi indossabili e piattaforme basate su browser utilizzando LiteRT-LM su larga scala.
Chiamata di funzioni on-device nella galleria Google AI Edge
Scopri come ottimizzare FunctionGemma e abilitare le funzionalità di chiamata di funzione basate sulle API LiteRT-LM Tool Use.
Modelli linguistici di piccole dimensioni, multimodalità e chiamate di funzione di Google AI Edge
Approfondimenti più recenti su RAG, multimodalità e chiamata di funzione per i modelli linguistici edge.