Premiers pas avec les modèles Gemma

La famille de modèles ouverts Gemma comprend une gamme de tailles, de fonctionnalités et de variantes spécialisées pour des tâches spécifiques afin de vous aider à créer des solutions génératives personnalisées. Voici les principaux chemins que vous pouvez suivre lorsque vous utilisez des modèles Gemma dans une application :

  • Sélectionnez un modèle et déployez-le tel quel dans votre application.
  • Sélectionnez un modèle, adaptez-le à une tâche spécifique, puis déployez-le dans une application ou partagez-le avec la communauté.

Ce guide vous aide à commencer à choisir un modèle, à tester ses fonctionnalités et, éventuellement, à l'adapter à votre application.

Obtenir sur Kaggle Obtenir sur Hugging Face

Choisir un modèle

Cette section vous aide à comprendre les variantes officielles de la famille de modèles Gemma et à sélectionner un modèle pour votre application. Les variantes de modèle offrent des fonctionnalités générales ou sont spécialisées pour des tâches spécifiques. Elles sont disponibles dans différentes tailles de paramètres afin que vous puissiez choisir un modèle qui possède les fonctionnalités de votre choix et qui répond à vos exigences de calcul.

Le tableau suivant répertorie les principales variantes de la famille de modèles Gemma et les plates-formes de déploiement prévues :

Famille Gemma 4

Dernière génération avec entrées multimodales (texte, image, audio)

Taille Variante Entrée ➔ Sortie Plate-forme prévue
E2B Gemma 4 (core) Texte, images, audio ➔ Texte Appareils mobiles
E4B Gemma 4 (core) Texte, images, audio ➔ Texte Appareils mobiles et ordinateurs portables
A4B Gemma 4 (core) Texte, images ➔ Texte Ordinateurs de bureau et petits serveurs
31B Gemma 4 (core) Texte, images ➔ Texte Serveurs ou clusters de serveurs de grande taille

Famille Gemma 3 et 3n

Modèles de base pour le traitement évolutif du texte et des images, ainsi que variantes "3n" pour des entrées multimodales étendues

Taille Variante Entrée ➔ Sortie Plate-forme prévue
270M Gemma 3 (core) Texte ➔ Texte Appareils mobiles et ordinateurs monocartes
1B Gemma 3 (core) Texte ➔ Texte Appareils mobiles et ordinateurs monocartes
E2B Gemma 3n Texte, images, audio ➔ Texte Appareils mobiles
4B Gemma 3 (core) Texte, images ➔ Texte Ordinateurs de bureau et petits serveurs
E4B Gemma 3n Texte, images, audio ➔ Texte Appareils mobiles et ordinateurs portables
12B Gemma 3 (core) Texte, images ➔ Texte Ordinateurs de bureau et serveurs haut de gamme
27B Gemma 3 (core) Texte, images ➔ Texte Serveurs ou clusters de serveurs de grande taille

Famille Gemma 2

Inclut les modèles de texte standards et les variantes multimodales de vision-langage PaliGemma 2

Taille Variante Entrée ➔ Sortie Plate-forme prévue
2B Gemma 2 (core) Texte ➔ Texte Appareils mobiles et ordinateurs portables
3B PaliGemma 2 Texte, images ➔ Texte Ordinateurs de bureau et petits serveurs
9B Gemma 2 (core) Texte ➔ Texte Ordinateurs de bureau et serveurs haut de gamme
10B PaliGemma 2 Texte, images ➔ Texte Ordinateurs de bureau et serveurs haut de gamme
27B Gemma 2 (core) Texte ➔ Texte Serveurs ou clusters de serveurs de grande taille
28B PaliGemma 2 Texte, images ➔ Texte Serveurs ou clusters de serveurs de grande taille

Famille Gemma 1

Génération d'origine, y compris les variantes spécifiques au codage

Taille Variante Entrée ➔ Sortie Plate-forme prévue
2B Gemma (core)
CodeGemma
Texte ➔ Texte Appareils mobiles et ordinateurs portables
7B Gemma (core)
CodeGemma
Texte ➔ Texte Ordinateurs de bureau et petits serveurs

La famille de modèles Gemma comprend également des modèles de recherche et à usage spécifique, y compris ShieldGemma, DataGemma, Gemma Scope, et Gemma-APS.

Tester des modèles

Vous pouvez tester les modèles Gemma en configurant un environnement de développement avec un modèle téléchargé et un logiciel compatible. Vous pouvez ensuite inviter le modèle et évaluer ses réponses. Utilisez l'un des notebooks Python suivants avec le framework de machine learning de votre choix pour configurer un environnement de test et inviter un modèle Gemma :

Régler les modèles

Vous pouvez modifier le comportement des modèles Gemma en les réglant. Pour régler un modèle, vous avez besoin d'un ensemble de données d'entrées et de réponses attendues de taille et de variation suffisantes pour guider le comportement du modèle. Vous avez également besoin de beaucoup plus de ressources de calcul et de mémoire pour exécuter un réglage que pour exécuter un modèle Gemma pour la génération de texte. Utilisez l'un des notebooks Python suivants pour configurer un environnement de développement de réglage et régler un modèle Gemma :

Étapes suivantes

Consultez ces guides pour créer d'autres solutions avec Gemma :