Die Gemma-Familie offener Modelle umfasst eine Reihe von Modellgrößen, Funktionen und aufgabenbezogenen Varianten, mit denen Sie benutzerdefinierte generative Lösungen entwickeln können. Dies sind die wichtigsten Möglichkeiten, Gemma-Modelle in einer Anwendung zu verwenden:
- Wählen Sie ein Modell aus und stellen Sie es unverändert in Ihrer Anwendung bereit.
- Wählen Sie ein Modell aus, optimieren Sie es für eine bestimmte Aufgabe und stellen Sie es dann in einer Anwendung bereit oder geben Sie es für die Community frei.
Dieser Leitfaden hilft Ihnen bei den ersten Schritten beim Auswählen eines Modells, beim Testen seiner Funktionen und optional beim Abstimmen des ausgewählten Modells für Ihre Anwendung.
Auf Kaggle herunterladen Auf Hugging Face herunterladen
Modell auswählen
In diesem Abschnitt erfahren Sie mehr über die offiziellen Varianten der Gemma-Modellfamilie und wie Sie ein Modell für Ihre Anwendung auswählen. Die Modellvarianten bieten allgemeine Funktionen oder sind auf bestimmte Aufgaben spezialisiert. Sie sind in verschiedenen Parametergrößen verfügbar, sodass Sie ein Modell auswählen können, das Ihren bevorzugten Funktionen entspricht und Ihre Rechenanforderungen erfüllt.
Liste der Gemma-Modelle
In der folgenden Tabelle sind die wichtigsten Varianten der Gemma-Modellfamilie und die vorgesehenen Bereitstellungsplattformen aufgeführt:
| Parametergröße | Eingabe | Ausgabe | Variante | Foundation | Vorhergesehene Plattformen |
|---|---|---|---|---|---|
| 270 Mio. | Text | Text | Gemma 3 | Mobilgeräte und Einplatinencomputer | |
| 1 Mrd. | Text | Text | Gemma 3 | Mobilgeräte und Einplatinencomputer | |
| E2B | Text, Bilder, Audio | Text | Gemma 3n | Mobilgeräte | |
| 2 Mrd. | Text | Text | Gemma 2 | Mobilgeräte und Laptops | |
| Gemma 1 | |||||
| 3 Mrd. | Text, Bilder | Text | Gemma 2 | Computer und kleine Server | |
| E4B | Text, Bilder, Audio | Text | Gemma 3n | Mobilgeräte und Laptops | |
| 4B | Text, Bilder | Text | Gemma 3 | Computer und kleine Server | |
| 7B | Text | Text | Gemma 1 | Computer und kleine Server | |
| 9 Mrd. | Text | Text | Gemma 2 | Hochwertige Computer und Server | |
| 10 Mrd. | Text, Bilder | Text | Gemma 2 | Hochwertige Computer und Server | |
| 12 Mrd. | Text, Bilder | Text | Gemma 3 | Hochwertige Computer und Server | |
| 27 Mrd. | Text, Bilder | Text | Gemma 3 | Große Server oder Servercluster | |
| Text | Text | Gemma 2 | |||
| 28B | Text, Bilder | Text | Gemma 2 | Große Server oder Servercluster |
Die Gemma-Modellfamilie umfasst auch Spezial- und Forschungsmodelle, darunter ShieldGemma, DataGemma, Gemma Scope und Gemma-APS.
Modelle testen
Sie können Gemma-Modelle testen, indem Sie eine Entwicklungsumgebung mit einem heruntergeladenen Modell und der entsprechenden Software einrichten. Sie können dann das Modell auffordern und seine Antworten bewerten. Verwenden Sie eines der folgenden Python-Notebooks mit Ihrem bevorzugten Framework für maschinelles Lernen, um eine Testumgebung einzurichten und ein Gemma-Modell zu verwenden:
Modelle abstimmen
Sie können das Verhalten von Gemma-Modellen ändern, indem Sie sie optimieren. Zum Optimieren eines Modells ist ein Dataset mit Eingaben und erwarteten Antworten erforderlich, das groß genug ist und genügend Variationen enthält, um das Verhalten des Modells zu steuern. Außerdem benötigen Sie für einen Tuning-Lauf deutlich mehr Rechen- und Arbeitsspeicherressourcen als für die Ausführung eines Gemma-Modells zur Textgenerierung. Verwenden Sie eines der folgenden Python-Notebooks, um eine Entwicklungsumgebung für die Optimierung einzurichten und ein Gemma-Modell zu optimieren:
- Gemma mit Keras und LoRA-Abstimmung optimieren
- Größere Gemma-Modelle mit verteiltem Training optimieren
Nächste Schritte
In diesen Leitfäden finden Sie Informationen zum Erstellen weiterer Lösungen mit Gemma: