Erste Schritte mit Gemma-Modellen

Die Gemma-Familie offener Modelle umfasst eine Reihe von Modellgrößen, Funktionen und aufgabenbezogenen Varianten, mit denen Sie benutzerdefinierte generative Lösungen entwickeln können. Dies sind die Hauptwege, die Sie bei der Verwendung von Gemma-Modellen in einer Anwendung einschlagen können:

  • Wählen Sie ein Modell aus und stellen Sie es unverändert in Ihrer Anwendung bereit.
  • Wählen Sie ein Modell aus, stimmen Sie es für eine bestimmte Aufgabe ab und stellen Sie es dann in einer Anwendung bereit oder teilen Sie es mit der Community.

Dieser Leitfaden hilft Ihnen bei den ersten Schritten mit der Modellauswahl, dem Testen der Funktionen und optional dem Abstimmen des ausgewählten Modells für Ihre Anwendung.

Auf Kaggle abrufen Auf Hugging Face abrufen

Modell auswählen

In diesem Abschnitt erfahren Sie mehr über die offiziellen Varianten der Gemma-Modellfamilie und können ein Modell für Ihre Anwendung auswählen. Die Modellvarianten bieten allgemeine Funktionen oder sind auf bestimmte Aufgaben spezialisiert. Sie sind in verschiedenen Parametergrößen verfügbar, sodass Sie ein Modell auswählen können, das Ihren bevorzugten Funktionen entspricht und Ihre Rechenanforderungen erfüllt.

In der folgenden Tabelle sind die wichtigsten Varianten der Gemma-Modellfamilie und die vorgesehenen Bereitstellungsplattformen aufgeführt:

Gemma 4-Familie

Die neueste Generation mit multimodalen Eingaben (Text, Bild, Audio).

Größe Variante Eingabe ➔ Ausgabe Vorgesehene Plattform
E2B Gemma 4 (Kern) Text, Bilder, Audio ➔ Text Mobilgeräte
E4B Gemma 4 (Kern) Text, Bilder, Audio ➔ Text Mobilgeräte und Laptops
A4B Gemma 4 (Kern) Text, Bilder ➔ Text Computer und kleine Server
31B Gemma 4 (Kern) Text, Bilder ➔ Text Große Server oder Servercluster

Gemma 3- und 3n-Familie

Kernmodelle für die skalierbare Text- und Bildverarbeitung sowie „3n“-Varianten für erweiterte multimodale Eingaben.

Größe Variante Eingabe ➔ Ausgabe Vorgesehene Plattform
270M Gemma 3 (Kern) Text ➔ Text Mobilgeräte und Einplatinencomputer
1B Gemma 3 (Kern) Text ➔ Text Mobilgeräte und Einplatinencomputer
E2B Gemma 3n Text, Bilder, Audio ➔ Text Mobilgeräte
4B Gemma 3 (Kern) Text, Bilder ➔ Text Computer und kleine Server
E4B Gemma 3n Text, Bilder, Audio ➔ Text Mobilgeräte und Laptops
12B Gemma 3 (Kern) Text, Bilder ➔ Text Hochwertige Computer und Server
27B Gemma 3 (Kern) Text, Bilder ➔ Text Große Server oder Servercluster

Gemma 2-Familie

Umfasst Standardtextmodelle und die multimodalen Varianten PaliGemma 2 für die Verarbeitung von Bild- und Textdaten.

Größe Variante Eingabe ➔ Ausgabe Vorgesehene Plattform
2B Gemma 2 (Kern) Text ➔ Text Mobilgeräte und Laptops
3B PaliGemma 2 Text, Bilder ➔ Text Computer und kleine Server
9B Gemma 2 (Kern) Text ➔ Text Hochwertige Computer und Server
10B PaliGemma 2 Text, Bilder ➔ Text Hochwertige Computer und Server
27B Gemma 2 (Kern) Text ➔ Text Große Server oder Servercluster
28B PaliGemma 2 Text, Bilder ➔ Text Große Server oder Servercluster

Gemma 1-Familie

Die ursprüngliche Generation, einschließlich codierungsspezifischer Varianten.

Größe Variante Eingabe ➔ Ausgabe Vorgesehene Plattform
2B Gemma (Kern)
CodeGemma
Text ➔ Text Mobilgeräte und Laptops
7B Gemma (Kern)
CodeGemma
Text ➔ Text Computer und kleine Server

Die Gemma-Modellfamilie umfasst auch Modelle für spezielle Zwecke und Forschungsmodelle, darunter ShieldGemma, DataGemma, Gemma Scope, und Gemma-APS.

Modelle testen

Sie können Gemma-Modelle testen, indem Sie eine Entwicklungsumgebung mit einem heruntergeladenen Modell und unterstützender Software einrichten. Anschließend können Sie das Modell auffordern, eine Antwort zu generieren, und die Antworten bewerten. Verwenden Sie eines der folgenden Python-Notebooks mit Ihrem bevorzugten Framework für maschinelles Lernen, um eine Testumgebung einzurichten und ein Gemma-Modell aufzufordern, eine Antwort zu generieren:

Modelle abstimmen

Sie können das Verhalten von Gemma-Modellen ändern, indem Sie sie abstimmen. Zum Abstimmen eines Modells ist ein Dataset mit Eingaben und erwarteten Antworten erforderlich, das groß genug und vielfältig genug ist, um das Verhalten des Modells zu steuern. Außerdem benötigen Sie für die Abstimmung deutlich mehr Rechen- und Arbeitsspeicherressourcen als für die Ausführung eines Gemma-Modells zur Textgenerierung. Verwenden Sie eines der folgenden Python-Notebooks, um eine Entwicklungsumgebung für die Abstimmung einzurichten und ein Gemma-Modell abzustimmen:

Nächste Schritte

In diesen Leitfäden erfahren Sie, wie Sie weitere Lösungen mit Gemma entwickeln können: