Convertir des modèles d'IA générative PyTorch pour l'inférence sur l'appareil

L'API AI Edge Torch Generative est une bibliothèque hautes performances conçue pour créer et convertir des modèles PyTorch basés sur des transformateurs au format LiteRT/LiteRT-LM. Les développeurs peuvent ainsi déployer facilement des modèles d'IA générative, en particulier des grands modèles de langage (LLM), pour la génération de texte et d'images sur l'appareil.

L'API Torch Generative est compatible avec la conversion de modèles pour l'exécution sur CPU et GPU. La compatibilité avec les NPU est en cours de développement. En associant l'API Torch Generative à LiteRT-LM, vous pouvez créer des applications réactives et respectueuses de la confidentialité qui exécutent des modèles génératifs entièrement sur l'appareil.

Pour en savoir plus, consultez le dépôt GitHub de l'API Generative Torch.