Google AI Edge | Google AI for Developers

Ti presentiamo Google AI Edge Portal: esegui il benchmarking dell'IA di Edge su larga scala. Registrati per richiedere l'accesso durante l'anteprima privata.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Eseguire LLM sul dispositivo con LiteRT-LM

Framework di inferenza open source pronto per la produzione progettato per fornire implementazioni LLM multipiattaforma ad alte prestazioni su dispositivi edge.

Panoramica Inizia

In evidenza

Migliora l'inferenza on-device di Gemma 4 con la previsione multi-token (MTP). Sperimenta velocità di decodifica più che doppie sulle GPU mobile senza alcuna perdita di qualità.

Post del blog Guida

Perché LiteRT-LM?

Piattaforma multipla

Implementa i LLM su Android, iOS, web e computer.

Accelerato hardware

Massimizza le prestazioni con l'accelerazione di GPU e NPU.

Ampie funzionalità di AI generativa

Supporto per LLM popolari, nonché per la multimodalità (visione, audio) e l'utilizzo di strumenti.

Inizia a creare

Python

API Python con accelerazione hardware su Linux, macOS, Windows e Raspberry Pi.

Guida di Python

Android

App Android native e strumenti desktop basati su JVM.

Guida di Android

iOS

Integrazione nativa con iOS e macOS con supporto Metal specializzato (API Swift in arrivo).

Guida C++

C++

API C++ multipiattaforma .

Guida C++

Unisciti alla Community

LiteRT-LM su GitHub

Contribuisci al progetto open source, segnala problemi e visualizza esempi.

Visualizza su GitHub

Hugging Face

Scarica modelli pre-convertiti (Gemma, Qwen e altri) e partecipa alla discussione.

Visualizza su Hugging Face

Blog e annunci

Porta competenze agentiche all'avanguardia all'edge con Gemma 4.

Esegui il deployment di Gemma 4 in-app e su una gamma più ampia di dispositivi con prestazioni e copertura eccezionali utilizzando LiteRT-LM.

GenAI on-device in Chrome, Chromebook Plus e Pixel Watch

Esegui il deployment di modelli linguistici su dispositivi indossabili e piattaforme basate su browser utilizzando LiteRT-LM su larga scala.

Chiamata di funzioni on-device nella galleria Google AI Edge

Scopri come ottimizzare FunctionGemma e abilitare le funzionalità di chiamata di funzione basate sulle API LiteRT-LM Tool Use.

Modelli linguistici di piccole dimensioni, multimodalità e chiamate di funzione di Google AI Edge

Approfondimenti più recenti su RAG, multimodalità e chiamata di funzione per i modelli linguistici edge.

Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.

Ultimo aggiornamento 2026-05-05 UTC.