Gemma 4 wurde veröffentlicht und unterstützt Text-, Audio- und Bildeingaben sowie ein langes Kontextfenster mit bis zu 256.000 Tokens. Weitere Informationen

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Erste Schritte mit Gemma-Modellen

Die Gemma-Familie offener Modelle umfasst eine Reihe von Modellgrößen, Funktionen und aufgabenbezogenen Varianten, mit denen Sie benutzerdefinierte generative Lösungen entwickeln können. Dies sind die Hauptwege, die Sie bei der Verwendung von Gemma-Modellen in einer Anwendung einschlagen können:

Wählen Sie ein Modell aus und stellen Sie es unverändert in Ihrer Anwendung bereit.
Wählen Sie ein Modell aus, stimmen Sie es für eine bestimmte Aufgabe ab und stellen Sie es dann in einer Anwendung bereit oder teilen Sie es mit der Community.

Dieser Leitfaden hilft Ihnen bei den ersten Schritten mit der Modellauswahl, dem Testen der Funktionen und optional dem Abstimmen des ausgewählten Modells für Ihre Anwendung.

Auf Kaggle abrufen Auf Hugging Face abrufen

Modell auswählen

In diesem Abschnitt erfahren Sie mehr über die offiziellen Varianten der Gemma-Modellfamilie und können ein Modell für Ihre Anwendung auswählen. Die Modellvarianten bieten allgemeine Funktionen oder sind auf bestimmte Aufgaben spezialisiert. Sie sind in verschiedenen Parametergrößen verfügbar, sodass Sie ein Modell auswählen können, das Ihren bevorzugten Funktionen entspricht und Ihre Rechenanforderungen erfüllt.

In der folgenden Tabelle sind die wichtigsten Varianten der Gemma-Modellfamilie und die vorgesehenen Bereitstellungsplattformen aufgeführt:

Gemma 4-Familie

Die neueste Generation mit multimodalen Eingaben (Text, Bild, Audio).

Größe	Variante	Eingabe ➔ Ausgabe	Vorgesehene Plattform
E2B	Gemma 4 (Kern)	Text, Bilder, Audio ➔ Text	Mobilgeräte
E4B	Gemma 4 (Kern)	Text, Bilder, Audio ➔ Text	Mobilgeräte und Laptops
A4B	Gemma 4 (Kern)	Text, Bilder ➔ Text	Computer und kleine Server
31B	Gemma 4 (Kern)	Text, Bilder ➔ Text	Große Server oder Servercluster

Gemma 3- und 3n-Familie

Kernmodelle für die skalierbare Text- und Bildverarbeitung sowie „3n“-Varianten für erweiterte multimodale Eingaben.

Größe	Variante	Eingabe ➔ Ausgabe	Vorgesehene Plattform
270M	Gemma 3 (Kern)	Text ➔ Text	Mobilgeräte und Einplatinencomputer
1B	Gemma 3 (Kern)	Text ➔ Text	Mobilgeräte und Einplatinencomputer
E2B	Gemma 3n	Text, Bilder, Audio ➔ Text	Mobilgeräte
4B	Gemma 3 (Kern)	Text, Bilder ➔ Text	Computer und kleine Server
E4B	Gemma 3n	Text, Bilder, Audio ➔ Text	Mobilgeräte und Laptops
12B	Gemma 3 (Kern)	Text, Bilder ➔ Text	Hochwertige Computer und Server
27B	Gemma 3 (Kern)	Text, Bilder ➔ Text	Große Server oder Servercluster

Gemma 2-Familie

Umfasst Standardtextmodelle und die multimodalen Varianten PaliGemma 2 für die Verarbeitung von Bild- und Textdaten.

Größe	Variante	Eingabe ➔ Ausgabe	Vorgesehene Plattform
2B	Gemma 2 (Kern)	Text ➔ Text	Mobilgeräte und Laptops
3B	PaliGemma 2	Text, Bilder ➔ Text	Computer und kleine Server
9B	Gemma 2 (Kern)	Text ➔ Text	Hochwertige Computer und Server
10B	PaliGemma 2	Text, Bilder ➔ Text	Hochwertige Computer und Server
27B	Gemma 2 (Kern)	Text ➔ Text	Große Server oder Servercluster
28B	PaliGemma 2	Text, Bilder ➔ Text	Große Server oder Servercluster

Gemma 1-Familie

Die ursprüngliche Generation, einschließlich codierungsspezifischer Varianten.

Größe	Variante	Eingabe ➔ Ausgabe	Vorgesehene Plattform
2B	Gemma (Kern) CodeGemma	Text ➔ Text	Mobilgeräte und Laptops
7B	Gemma (Kern) CodeGemma	Text ➔ Text	Computer und kleine Server

Die Gemma-Modellfamilie umfasst auch Modelle für spezielle Zwecke und Forschungsmodelle, darunter ShieldGemma, DataGemma, Gemma Scope, und Gemma-APS.

Modelle testen

Sie können Gemma-Modelle testen, indem Sie eine Entwicklungsumgebung mit einem heruntergeladenen Modell und unterstützender Software einrichten. Anschließend können Sie das Modell auffordern, eine Antwort zu generieren, und die Antworten bewerten. Verwenden Sie eines der folgenden Python-Notebooks mit Ihrem bevorzugten Framework für maschinelles Lernen, um eine Testumgebung einzurichten und ein Gemma-Modell aufzufordern, eine Antwort zu generieren:

Modelle abstimmen

Sie können das Verhalten von Gemma-Modellen ändern, indem Sie sie abstimmen. Zum Abstimmen eines Modells ist ein Dataset mit Eingaben und erwarteten Antworten erforderlich, das groß genug und vielfältig genug ist, um das Verhalten des Modells zu steuern. Außerdem benötigen Sie für die Abstimmung deutlich mehr Rechen- und Arbeitsspeicherressourcen als für die Ausführung eines Gemma-Modells zur Textgenerierung. Verwenden Sie eines der folgenden Python-Notebooks, um eine Entwicklungsumgebung für die Abstimmung einzurichten und ein Gemma-Modell abzustimmen:

Nächste Schritte

In diesen Leitfäden erfahren Sie, wie Sie weitere Lösungen mit Gemma entwickeln können: