Die offenen Modelle der Gemma-Familie umfassen eine Reihe von Modellgrößen, Funktionen und aufgabenspezifische Varianten zum Erstellen benutzerdefinierter generativer Lösungen. Dies sind die Hauptpfade, die Sie bei der Verwendung von Gemma-Modellen in einer Anwendung verwenden können:
- Modell auswählen und in der Anwendung im aktuellen Zustand bereitstellen
- Wählen Sie ein Modell aus, optimieren Sie es für eine bestimmte Aufgabe und stellen Sie es dann in einer Anwendung bereit oder geben Sie es für die Community frei.
In dieser Anleitung erfahren Sie, wie Sie ein Modell auswählen, seine Funktionen testen und optional das für Ihre Anwendung ausgewählte Modell optimieren.
Modell auswählen
In diesem Abschnitt erhalten Sie Informationen zu den offiziellen Varianten der Gemma-Modellfamilie und können ein Modell für Ihre Anwendung auswählen. Die Modellvarianten bieten allgemeine Funktionen oder sind auf bestimmte Aufgaben spezialisiert. Sie werden in verschiedenen Parametergrößen bereitgestellt, damit Sie ein Modell auswählen können, das Ihre bevorzugten Funktionen hat und Ihren Computing-Anforderungen entspricht.
Liste der Gemma-Modelle
In der folgenden Tabelle sind die wichtigsten Varianten der Gemma-Modellfamilie und ihre übergeordneten Funktionen aufgeführt:
Parametergröße | Eingang | Ausgang | Architektur | Varianten | Vorhergesehene Plattformen |
---|---|---|---|---|---|
2 Milliarden | Text | Text | Gemma 1 | Mobilgeräte und Laptops | |
3 Mrd. | Text, Bilder | Text | Gemma 1 | Mobilgeräte und Laptops | |
7 Mrd. | Text | Text | Gemma 1 | Computer und kleine Server | |
9 Mrd. | Text | Text | High-End-Desktop-Computer und -Server | ||
27 Mrd. | Text | Text | Gemma 2 | Große Server oder Servercluster |
Sie können alle offiziellen Gemma-Modellvarianten bei Kaggle Models herunterladen.
Testmodelle
Sie können Gemma-Modelle testen, indem Sie eine Entwicklungsumgebung mit einem heruntergeladenen Modell und unterstützender Software einrichten. Sie können dann das Modell auffordern und seine Antworten bewerten. Verwenden Sie eines der folgenden Python-Notebooks mit Ihrem bevorzugten Framework für maschinelles Lernen, um eine Testumgebung einzurichten und ein Gemma-Modell aufzurufen:
Gemma 2 in AI Studio testen
Mit Google AI Studio können Sie Gemma 2 schnell testen, ohne eine Entwicklungsumgebung einzurichten. Mit dieser Webanwendung können Sie Prompts mit Gemma 2 ausprobieren und deren Funktionen bewerten.
So testen Sie Gemma 2 in Google AI Studio:
Öffnen Sie AI Studio.
Wählen Sie rechts im Bereich Run settings (Ausführungseinstellungen) im Feld Model (Modell) ein Gemma 2-Modell aus.
Geben Sie unten im mittleren Bereich eine Eingabeaufforderung ein und wählen Sie Ausführen aus.
Weitere Informationen zur Verwendung von AI Studio finden Sie in der Kurzanleitung zu Google AI Studio.
Modelle abstimmen
Sie können das Verhalten von Gemma-Modellen ändern, indem Sie sie abstimmen. Für die Feinabstimmung eines Modells ist ein Dataset mit Eingaben und erwarteten Antworten von ausreichender Größe und Abweichung erforderlich, um das Verhalten des Modells zu steuern. Außerdem benötigen Sie deutlich mehr Rechen- und Speicherressourcen, um einen Abstimmungsdurchlauf durchzuführen, als ein Gemma-Modell für die Textgenerierung auszuführen. Verwenden Sie eines der folgenden Python-Notebooks, um eine Feinabstimmungsentwicklungsumgebung einzurichten und ein Gemma-Modell abzustimmen:
- Tune Gemma mit Keras- und LoRA-Abstimmung
- Tune Gemma mit JAX
- Größere Gemma-Modelle mit verteiltem Training optimieren
Nächste Schritte
Sehen Sie sich diese Leitfäden zum Erstellen weiterer Lösungen mit Gemma an: