Die Gemma-Familie offener Modelle umfasst eine Reihe von Modellgrößen, Funktionen und aufgabenbezogenen Varianten, mit denen Sie benutzerdefinierte generative Lösungen entwickeln können. Dies sind die Hauptwege, die Sie bei der Verwendung von Gemma-Modellen in einer Anwendung einschlagen können:
- Wählen Sie ein Modell aus und stellen Sie es unverändert in Ihrer Anwendung bereit.
- Wählen Sie ein Modell aus, stimmen Sie es für eine bestimmte Aufgabe ab und stellen Sie es dann in einer Anwendung bereit oder teilen Sie es mit der Community.
Dieser Leitfaden hilft Ihnen bei den ersten Schritten mit der Modellauswahl, dem Testen der Funktionen und optional dem Abstimmen des ausgewählten Modells für Ihre Anwendung.
Auf Kaggle abrufen Auf Hugging Face abrufen
Modell auswählen
In diesem Abschnitt erfahren Sie mehr über die offiziellen Varianten der Gemma-Modellfamilie und können ein Modell für Ihre Anwendung auswählen. Die Modellvarianten bieten allgemeine Funktionen oder sind auf bestimmte Aufgaben spezialisiert. Sie sind in verschiedenen Parametergrößen verfügbar, sodass Sie ein Modell auswählen können, das Ihren bevorzugten Funktionen entspricht und Ihre Rechenanforderungen erfüllt.
In der folgenden Tabelle sind die wichtigsten Varianten der Gemma-Modellfamilie und die vorgesehenen Bereitstellungsplattformen aufgeführt:
Gemma 4-Familie
Die neueste Generation mit multimodalen Eingaben (Text, Bild, Audio).
| Größe | Variante | Eingabe ➔ Ausgabe | Vorgesehene Plattform |
|---|---|---|---|
| E2B | Gemma 4 (Kern) | Text, Bilder, Audio ➔ Text | Mobilgeräte |
| E4B | Gemma 4 (Kern) | Text, Bilder, Audio ➔ Text | Mobilgeräte und Laptops |
| A4B | Gemma 4 (Kern) | Text, Bilder ➔ Text | Computer und kleine Server |
| 31B | Gemma 4 (Kern) | Text, Bilder ➔ Text | Große Server oder Servercluster |
Gemma 3- und 3n-Familie
Kernmodelle für die skalierbare Text- und Bildverarbeitung sowie „3n“-Varianten für erweiterte multimodale Eingaben.
| Größe | Variante | Eingabe ➔ Ausgabe | Vorgesehene Plattform |
|---|---|---|---|
| 270M | Gemma 3 (Kern) | Text ➔ Text | Mobilgeräte und Einplatinencomputer |
| 1B | Gemma 3 (Kern) | Text ➔ Text | Mobilgeräte und Einplatinencomputer |
| E2B | Gemma 3n | Text, Bilder, Audio ➔ Text | Mobilgeräte |
| 4B | Gemma 3 (Kern) | Text, Bilder ➔ Text | Computer und kleine Server |
| E4B | Gemma 3n | Text, Bilder, Audio ➔ Text | Mobilgeräte und Laptops |
| 12B | Gemma 3 (Kern) | Text, Bilder ➔ Text | Hochwertige Computer und Server |
| 27B | Gemma 3 (Kern) | Text, Bilder ➔ Text | Große Server oder Servercluster |
Gemma 2-Familie
Umfasst Standardtextmodelle und die multimodalen Varianten PaliGemma 2 für die Verarbeitung von Bild- und Textdaten.
| Größe | Variante | Eingabe ➔ Ausgabe | Vorgesehene Plattform |
|---|---|---|---|
| 2B | Gemma 2 (Kern) | Text ➔ Text | Mobilgeräte und Laptops |
| 3B | PaliGemma 2 | Text, Bilder ➔ Text | Computer und kleine Server |
| 9B | Gemma 2 (Kern) | Text ➔ Text | Hochwertige Computer und Server |
| 10B | PaliGemma 2 | Text, Bilder ➔ Text | Hochwertige Computer und Server |
| 27B | Gemma 2 (Kern) | Text ➔ Text | Große Server oder Servercluster |
| 28B | PaliGemma 2 | Text, Bilder ➔ Text | Große Server oder Servercluster |
Gemma 1-Familie
Die ursprüngliche Generation, einschließlich codierungsspezifischer Varianten.
| Größe | Variante | Eingabe ➔ Ausgabe | Vorgesehene Plattform |
|---|---|---|---|
| 2B | Gemma (Kern) CodeGemma |
Text ➔ Text | Mobilgeräte und Laptops |
| 7B | Gemma (Kern) CodeGemma |
Text ➔ Text | Computer und kleine Server |
Die Gemma-Modellfamilie umfasst auch Modelle für spezielle Zwecke und Forschungsmodelle, darunter ShieldGemma, DataGemma, Gemma Scope, und Gemma-APS.
Modelle testen
Sie können Gemma-Modelle testen, indem Sie eine Entwicklungsumgebung mit einem heruntergeladenen Modell und unterstützender Software einrichten. Anschließend können Sie das Modell auffordern, eine Antwort zu generieren, und die Antworten bewerten. Verwenden Sie eines der folgenden Python-Notebooks mit Ihrem bevorzugten Framework für maschinelles Lernen, um eine Testumgebung einzurichten und ein Gemma-Modell aufzufordern, eine Antwort zu generieren:
Modelle abstimmen
Sie können das Verhalten von Gemma-Modellen ändern, indem Sie sie abstimmen. Zum Abstimmen eines Modells ist ein Dataset mit Eingaben und erwarteten Antworten erforderlich, das groß genug und vielfältig genug ist, um das Verhalten des Modells zu steuern. Außerdem benötigen Sie für die Abstimmung deutlich mehr Rechen- und Arbeitsspeicherressourcen als für die Ausführung eines Gemma-Modells zur Textgenerierung. Verwenden Sie eines der folgenden Python-Notebooks, um eine Entwicklungsumgebung für die Abstimmung einzurichten und ein Gemma-Modell abzustimmen:
- Gemma mit Keras und LoRA-Abstimmung abstimmen
- Größere Gemma-Modelle mit verteiltem Training abstimmen
Nächste Schritte
In diesen Leitfäden erfahren Sie, wie Sie weitere Lösungen mit Gemma entwickeln können: