Présentation du modèle Gemma 3

Gemma est une famille de modèles d'intelligence artificielle (IA) générative. Vous pouvez les utiliser dans une grande variété de tâches de génération, y compris la réponse aux questions, la synthèse et le raisonnement. Les modèles Gemma sont fournis avec des poids ouverts et autorisent une utilisation commerciale responsable, ce qui vous permet de les ajuster et de les déployer dans vos propres projets et applications.

La version Gemma 3 inclut les principales fonctionnalités suivantes. Essayez-le dans AI Studio:

Vous pouvez télécharger des modèles Gemma 3 sur Kaggle et Hugging Face. Pour en savoir plus sur les caractéristiques techniques de Gemma 3, consultez la fiche de modèle et le rapport technique. Les versions antérieures des modèles principaux Gemma sont également disponibles en téléchargement. Pour en savoir plus, consultez la section Anciens modèles Gemma.

Essayer Gemma 3 Obtenir Gemma sur Kaggle Obtenir Gemma sur Hugging Face

Entrée multimodale d'images et de texte

Gemma 3 vous permet de réaliser des tâches d'analyse et de génération plus complexes grâce à sa capacité à gérer les données d'image et de texte. Vous pouvez utiliser le modèle pour interpréter les données d'image, identifier des objets, extraire des données textuelles et effectuer de nombreuses autres tâches de conversion d'entrée visuelle en sortie textuelle. À vos briques

Fenêtre de contexte de 128 000 jetons

Les modèles Gemma 3 peuvent gérer des entrées de requêtes jusqu'à 128 000 jetons, soit une fenêtre de contexte 16 fois plus grande que les modèles Gemma précédents. Le grand nombre de jetons vous permet de traiter plusieurs articles multipages, des articles plus volumineux ou des centaines d'images dans une seule requête.

Compatibilité avec de nombreuses langues

Travaillez dans votre langue grâce à la prise en charge intégrée de plus de 140 langues. Gemma 3 est entraîné pour prendre en charge un grand nombre de langues par rapport aux versions précédentes de Gemma. Vous pouvez ainsi effectuer plus de tâches visuelles et textuelles dans les langues que vos clients utilisent. À vos briques

Tailles des paramètres et quantification

Les modèles Gemma 3 sont disponibles en quatre tailles de paramètres à cinq niveaux de précision, de la précision complète à 32 bits à la précision la plus faible à 4 bits. Les différentes tailles et précisions représentent un ensemble de compromis pour votre application d'IA. Les modèles avec un nombre de paramètres et de bits plus élevé (plus de précision) sont généralement plus performants, mais plus coûteux à exécuter en termes de cycles de traitement, de coût de mémoire et de consommation d'énergie. Les modèles avec un nombre de paramètres et de bits inférieur (précision inférieure) ont moins de fonctionnalités, mais peuvent être suffisants pour votre tâche d'IA. Le tableau suivant détaille les exigences de mémoire approximatives du GPU ou du TPU pour exécuter des inférences avec chaque taille des versions du modèle Gemma 3.

Paramètres 32 bits complets BF16 (16 bits) SFP8
(8 bits)
Q4_0
(4 bits)
INT4
(4 bits)
Gemma 3 1B (texte uniquement) 4 Go 1,5 Go 1,1 Go 892 Mo 861 Mo
Gemma 3 4B 16 Go 6,4 Go 4,4 Go 3,4 Go 3,2 Go
Gemma 3 12B 48 Go 20 Go 12,2 Go 8,7 Go 8,2 Go
Gemma 3 27B 108 Go 46,4 Go 29,1 Go 21 Go 19,9 Go

Tableau 1. Mémoire GPU ou TPU approximative requise pour charger des modèles Gemma 3 en fonction du nombre de paramètres et du niveau de quantification (profondeur de bits).

La consommation de mémoire augmente en fonction du nombre total de jetons requis pour l'invite que vous exécutez. Plus le nombre de jetons requis pour traiter votre requête est élevé, plus la mémoire requise est importante, en plus de la mémoire requise pour charger le modèle.

Modèles Gemma précédents

Vous pouvez travailler avec les générations précédentes de modèles Gemma, qui sont également disponibles sur Kaggle et Hugging Face. Pour en savoir plus sur les détails techniques des modèles Gemma précédents, consultez les pages de fiche de modèle suivantes:

Prêt à développer vos compétences ? Commencez à utiliser les modèles Gemma.