Google AI Edge | Google AI for Developers

Présentation de Google AI Edge Portal: évaluez l'IA Edge à grande échelle. Inscrivez-vous pour demander l'accès pendant l'aperçu privé.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Exécuter des LLM sur l'appareil avec LiteRT-LM

Framework d'inférence Open Source prêt pour la production, conçu pour déployer des LLM hautes performances et multiplates-formes sur des appareils périphériques.

Aperçu Débuter

Sélection du moment

Boostez l'inférence Gemma 4 sur l'appareil grâce à la prédiction multitoken (MTP). Profitez d'une vitesse de décodage plus de deux fois supérieure sur les GPU mobiles, sans aucune dégradation de la qualité.

Article de blog Guide

Pourquoi LiteRT-LM ?

Multiplate-forme

Déployez des LLM sur Android, iOS, le Web et les ordinateurs.

Accélération matérielle

Maximisez les performances grâce à l'accélération GPU et NPU.

Fonctionnalités d'IA générative étendues

Prise en charge des LLM populaires, ainsi que de la multimodalité (Vision, Audio) et de l'utilisation d'outils.

Démarrer la création

Python

API Python avec accélération matérielle sur Linux, macOS, Windows et Raspberry Pi.

Guide Python

Android

Applications Android natives et outils de bureau basés sur la JVM.

iOS

API Swift natives pour iOS (macOS bientôt disponible).

Guide Swift

Web

API JavaScript et TypeScript pour les applications Web basées sur navigateur avec accélération WebGPU.

Web Guide

Flutter

Créez des applications Flutter multiplates-formes à l'aide du package flutter_gemma géré par la communauté.

C++

API C++ multiplate-formes

Guide C++

Générateur de fichiers

Créez des fichiers .litertlm à partir de modèles LiteRT convertis.

Guide du générateur de fichiers

Rejoignez la communauté

LiteRT-LM sur GitHub

Contribuez au projet Open Source, signalez des problèmes et consultez des exemples.

Afficher sur GitHub

Hugging Face

Téléchargez des modèles pré-convertis (Gemma, Qwen et plus encore) et participez à la discussion.

Afficher sur Hugging Face

Blogs et annonces

Profitez de compétences agentives de pointe en périphérie grâce à Gemma 4.

Déployez Gemma 4 dans votre application et sur une plus large gamme d'appareils avec des performances et une couverture exceptionnelles grâce à LiteRT-LM.

IA générative sur l'appareil dans Chrome, Chromebook Plus et Pixel Watch

Déployez des modèles de langage sur des plates-formes portables et basées sur navigateur à l'aide de LiteRT-LM à grande échelle.

Appel de fonction sur l'appareil dans Google AI Edge Gallery

Découvrez comment affiner FunctionGemma et activer les fonctionnalités d'appel de fonction optimisées par les API d'utilisation d'outils LiteRT-LM.

Petits modèles de langage, multimodalité et appel de fonction Google AI Edge

Dernières informations sur la RAG, la multimodalité et les appels de fonction pour les modèles de langage Edge.

Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.

Dernière mise à jour le 2026/05/18 (UTC).