Google AI Edge | Google AI for Developers

Ti presentiamo Google AI Edge Portal: esegui il benchmarking dell'IA di Edge su larga scala. Registrati per richiedere l'accesso durante l'anteprima privata.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Eseguire LLM sul dispositivo con LiteRT-LM

Framework di inferenza open source pronto per la produzione progettato per fornire implementazioni LLM multipiattaforma ad alte prestazioni su dispositivi edge.

Panoramica Inizia

In evidenza

Dai un'occhiata al nostro ultimo blog per scoprire come LiteRT-LM potenzia le implementazioni di AI generativa on-device, sfruttando tutto il potenziale di Gemma 4 con velocità incredibile ed efficienza straordinaria grazie alle API Swift, JavaScript e Flutter appena aggiunte.

Post del blog Panoramica

Perché LiteRT-LM?

Piattaforma multipla

Implementa i LLM su Android, iOS, web e computer.

Accelerato hardware

Massimizza le prestazioni con l'accelerazione di GPU e NPU.

Ampie funzionalità di AI generativa

Supporto per LLM popolari, nonché per la multimodalità (visione, audio) e l'utilizzo di strumenti.

Inizia a creare

Python

API Python con accelerazione hardware su Linux, macOS, Windows e Raspberry Pi.

Guida di Python

Android

App Android native e strumenti desktop basati su JVM.

Guida di Android

iOS

API Swift native per iOS (macOS disponibile a breve).

Web

API JavaScript e TypeScript per app web basate su browser con accelerazione WebGPU.

Guida web

Flutter

Crea app Flutter multipiattaforma utilizzando il pacchetto flutter_gemma gestito dalla community.

Guida di Flutter

C++

API C++ multipiattaforma .

Guida C++

File Builder

Crea file .litertlm dai modelli LiteRT convertiti.

Guida alla creazione di file

Unisciti alla Community

LiteRT-LM su GitHub

Contribuisci al progetto open source, segnala problemi e visualizza esempi.

Visualizza su GitHub

Hugging Face

Scarica modelli pre-convertiti (Gemma, Qwen e altri) e partecipa alla discussione.

Visualizza su Hugging Face

Blog e annunci

Migliorare l'inferenza on-device di Gemma 4 con la previsione multi-token (MTP)

Sperimenta velocità di decodifica più che doppie sulle GPU mobile senza alcuna perdita di qualità.

Porta competenze agentiche all'avanguardia all'edge con Gemma 4.

Esegui il deployment di Gemma 4 in-app e su una gamma più ampia di dispositivi con prestazioni e copertura eccezionali utilizzando LiteRT-LM.

GenAI on-device in Chrome, Chromebook Plus e Pixel Watch

Esegui il deployment di modelli linguistici su dispositivi indossabili e piattaforme basate su browser utilizzando LiteRT-LM su larga scala.

Chiamata di funzioni on-device nella galleria Google AI Edge

Scopri come ottimizzare FunctionGemma e abilitare le funzionalità di chiamata di funzione basate sulle API LiteRT-LM Tool Use.

Modelli linguistici di piccole dimensioni, multimodalità e chiamate di funzione di Google AI Edge

Approfondimenti più recenti su RAG, multimodalità e chiamata di funzione per i modelli linguistici edge.

Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.

Ultimo aggiornamento 2026-05-19 UTC.