utilisation commerciale responsable, ce qui vous permet de les ajuster et de les déployer dans vos propres projets et applications.
Gemma est une famille de modèles d'intelligence artificielle (IA) générative. Vous pouvez les utiliser dans une grande variété de tâches de génération, y compris la réponse aux questions, la synthèse et le raisonnement. Les modèles Gemma sont fournis avec des poids ouverts et autorisent uneLa version Gemma 3 inclut les principales fonctionnalités suivantes. Essayez-le dans AI Studio:
- Saisie d'images et de texte: les fonctionnalités multimodales vous permettent de saisir des images et du texte pour comprendre et analyser les données visuelles. Commencer à créer
- Contexte de jeton 128 ko: contexte d'entrée 16 fois plus important pour analyser plus de données et résoudre des problèmes plus complexes.
- Compatibilité avec de nombreuses langues: travaillez dans votre langue ou étendez les fonctionnalités linguistiques de votre application d'IA avec la prise en charge de plus de 140 langues. Commencer à créer
- Tailles de modèle adaptées aux développeurs : choisissez une taille de modèle (1 milliard, 4 milliards, 12 milliards ou 27 milliards) et un niveau de précision qui conviennent le mieux à votre tâche et à vos ressources de calcul.
Vous pouvez télécharger des modèles Gemma 3 sur Kaggle et Hugging Face. Pour en savoir plus sur les caractéristiques techniques de Gemma 3, consultez la fiche de modèle et le rapport technique. Les versions antérieures des modèles principaux Gemma sont également disponibles en téléchargement. Pour en savoir plus, consultez la section Anciens modèles Gemma.
Essayer Gemma 3 Obtenir Gemma sur Kaggle Obtenir Gemma sur Hugging Face
Entrée multimodale d'images et de texte
Gemma 3 vous permet de réaliser des tâches d'analyse et de génération plus complexes grâce à sa capacité à gérer les données d'image et de texte. Vous pouvez utiliser le modèle pour interpréter les données d'image, identifier des objets, extraire des données textuelles et effectuer de nombreuses autres tâches de conversion d'entrée visuelle en sortie textuelle. À vos briques
Fenêtre de contexte de 128 000 jetons
Les modèles Gemma 3 peuvent gérer des entrées de requêtes jusqu'à 128 000 jetons, soit une fenêtre de contexte 16 fois plus grande que les modèles Gemma précédents. Le grand nombre de jetons vous permet de traiter plusieurs articles multipages, des articles plus volumineux ou des centaines d'images dans une seule requête.
Compatibilité avec de nombreuses langues
Travaillez dans votre langue grâce à la prise en charge intégrée de plus de 140 langues. Gemma 3 est entraîné pour prendre en charge un grand nombre de langues par rapport aux versions précédentes de Gemma. Vous pouvez ainsi effectuer plus de tâches visuelles et textuelles dans les langues que vos clients utilisent. À vos briques
Tailles des paramètres et quantification
Les modèles Gemma 3 sont disponibles en quatre tailles de paramètres à cinq niveaux de précision, de la précision complète à 32 bits à la précision la plus faible à 4 bits. Les différentes tailles et précisions représentent un ensemble de compromis pour votre application d'IA. Les modèles avec un nombre de paramètres et de bits plus élevé (plus de précision) sont généralement plus performants, mais plus coûteux à exécuter en termes de cycles de traitement, de coût de mémoire et de consommation d'énergie. Les modèles avec un nombre de paramètres et de bits inférieur (précision inférieure) ont moins de fonctionnalités, mais peuvent être suffisants pour votre tâche d'IA. Le tableau suivant détaille les exigences de mémoire approximatives du GPU ou du TPU pour exécuter des inférences avec chaque taille des versions du modèle Gemma 3.
Paramètres | 32 bits complets | BF16 (16 bits) | SFP8 (8 bits) |
Q4_0 (4 bits) |
INT4 (4 bits) |
---|---|---|---|---|---|
Gemma 3 1B (texte uniquement) | 4 Go | 1,5 Go | 1,1 Go | 892 Mo | 861 Mo |
Gemma 3 4B | 16 Go | 6,4 Go | 4,4 Go | 3,4 Go | 3,2 Go |
Gemma 3 12B | 48 Go | 20 Go | 12,2 Go | 8,7 Go | 8,2 Go |
Gemma 3 27B | 108 Go | 46,4 Go | 29,1 Go | 21 Go | 19,9 Go |
Tableau 1. Mémoire GPU ou TPU approximative requise pour charger des modèles Gemma 3 en fonction du nombre de paramètres et du niveau de quantification (profondeur de bits).
La consommation de mémoire augmente en fonction du nombre total de jetons requis pour l'invite que vous exécutez. Plus le nombre de jetons requis pour traiter votre requête est élevé, plus la mémoire requise est importante, en plus de la mémoire requise pour charger le modèle.
Modèles Gemma précédents
Vous pouvez travailler avec les générations précédentes de modèles Gemma, qui sont également disponibles sur Kaggle et Hugging Face. Pour en savoir plus sur les détails techniques des modèles Gemma précédents, consultez les pages de fiche de modèle suivantes:
- Fiche de modèle Gemma 2
- Fiche de modèle Gemma 1
Prêt à développer vos compétences ? Commencez à utiliser les modèles Gemma.