La famille de modèles ouverts Gemma comprend une gamme de tailles, de fonctionnalités et de variantes spécialisées pour des tâches spécifiques afin de vous aider à créer des solutions génératives personnalisées. Voici les principaux chemins que vous pouvez suivre lorsque vous utilisez des modèles Gemma dans une application :
- Sélectionnez un modèle et déployez-le tel quel dans votre application.
- Sélectionnez un modèle, adaptez-le à une tâche spécifique, puis déployez-le dans une application ou partagez-le avec la communauté.
Ce guide vous aide à commencer à choisir un modèle, à tester ses fonctionnalités et, éventuellement, à l'adapter à votre application.
Obtenir sur Kaggle Obtenir sur Hugging Face
Choisir un modèle
Cette section vous aide à comprendre les variantes officielles de la famille de modèles Gemma et à sélectionner un modèle pour votre application. Les variantes de modèle offrent des fonctionnalités générales ou sont spécialisées pour des tâches spécifiques. Elles sont disponibles dans différentes tailles de paramètres afin que vous puissiez choisir un modèle qui possède les fonctionnalités de votre choix et qui répond à vos exigences de calcul.
Le tableau suivant répertorie les principales variantes de la famille de modèles Gemma et les plates-formes de déploiement prévues :
Famille Gemma 4
Dernière génération avec entrées multimodales (texte, image, audio)
| Taille | Variante | Entrée ➔ Sortie | Plate-forme prévue |
|---|---|---|---|
| E2B | Gemma 4 (core) | Texte, images, audio ➔ Texte | Appareils mobiles |
| E4B | Gemma 4 (core) | Texte, images, audio ➔ Texte | Appareils mobiles et ordinateurs portables |
| A4B | Gemma 4 (core) | Texte, images ➔ Texte | Ordinateurs de bureau et petits serveurs |
| 31B | Gemma 4 (core) | Texte, images ➔ Texte | Serveurs ou clusters de serveurs de grande taille |
Famille Gemma 3 et 3n
Modèles de base pour le traitement évolutif du texte et des images, ainsi que variantes "3n" pour des entrées multimodales étendues
| Taille | Variante | Entrée ➔ Sortie | Plate-forme prévue |
|---|---|---|---|
| 270M | Gemma 3 (core) | Texte ➔ Texte | Appareils mobiles et ordinateurs monocartes |
| 1B | Gemma 3 (core) | Texte ➔ Texte | Appareils mobiles et ordinateurs monocartes |
| E2B | Gemma 3n | Texte, images, audio ➔ Texte | Appareils mobiles |
| 4B | Gemma 3 (core) | Texte, images ➔ Texte | Ordinateurs de bureau et petits serveurs |
| E4B | Gemma 3n | Texte, images, audio ➔ Texte | Appareils mobiles et ordinateurs portables |
| 12B | Gemma 3 (core) | Texte, images ➔ Texte | Ordinateurs de bureau et serveurs haut de gamme |
| 27B | Gemma 3 (core) | Texte, images ➔ Texte | Serveurs ou clusters de serveurs de grande taille |
Famille Gemma 2
Inclut les modèles de texte standards et les variantes multimodales de vision-langage PaliGemma 2
| Taille | Variante | Entrée ➔ Sortie | Plate-forme prévue |
|---|---|---|---|
| 2B | Gemma 2 (core) | Texte ➔ Texte | Appareils mobiles et ordinateurs portables |
| 3B | PaliGemma 2 | Texte, images ➔ Texte | Ordinateurs de bureau et petits serveurs |
| 9B | Gemma 2 (core) | Texte ➔ Texte | Ordinateurs de bureau et serveurs haut de gamme |
| 10B | PaliGemma 2 | Texte, images ➔ Texte | Ordinateurs de bureau et serveurs haut de gamme |
| 27B | Gemma 2 (core) | Texte ➔ Texte | Serveurs ou clusters de serveurs de grande taille |
| 28B | PaliGemma 2 | Texte, images ➔ Texte | Serveurs ou clusters de serveurs de grande taille |
Famille Gemma 1
Génération d'origine, y compris les variantes spécifiques au codage
| Taille | Variante | Entrée ➔ Sortie | Plate-forme prévue |
|---|---|---|---|
| 2B | Gemma (core) CodeGemma |
Texte ➔ Texte | Appareils mobiles et ordinateurs portables |
| 7B | Gemma (core) CodeGemma |
Texte ➔ Texte | Ordinateurs de bureau et petits serveurs |
La famille de modèles Gemma comprend également des modèles de recherche et à usage spécifique, y compris ShieldGemma, DataGemma, Gemma Scope, et Gemma-APS.
Tester des modèles
Vous pouvez tester les modèles Gemma en configurant un environnement de développement avec un modèle téléchargé et un logiciel compatible. Vous pouvez ensuite inviter le modèle et évaluer ses réponses. Utilisez l'un des notebooks Python suivants avec le framework de machine learning de votre choix pour configurer un environnement de test et inviter un modèle Gemma :
Régler les modèles
Vous pouvez modifier le comportement des modèles Gemma en les réglant. Pour régler un modèle, vous avez besoin d'un ensemble de données d'entrées et de réponses attendues de taille et de variation suffisantes pour guider le comportement du modèle. Vous avez également besoin de beaucoup plus de ressources de calcul et de mémoire pour exécuter un réglage que pour exécuter un modèle Gemma pour la génération de texte. Utilisez l'un des notebooks Python suivants pour configurer un environnement de développement de réglage et régler un modèle Gemma :
- Régler Gemma avec Keras et le réglage LoRA
- Régler des modèles Gemma plus volumineux avec l'entraînement distribué
Étapes suivantes
Consultez ces guides pour créer d'autres solutions avec Gemma :