Gemma 4 è stato rilasciato con input di testo, audio e immagini e una finestra contestuale lunga fino a 256.000 token. Scopri di più

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Inizia a utilizzare i modelli Gemma

La famiglia di modelli open Gemma include una gamma di dimensioni, funzionalità e varianti specializzate per attività per aiutarti a creare soluzioni generative personalizzate. Questi sono i principali percorsi che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:

Seleziona un modello e esegui il deployment così com'è nella tua applicazione
Seleziona un modello, ottimizzalo per un'attività specifica e poi esegui il deployment in un'applicazione o condividilo con la community.

Questa guida ti aiuta a iniziare a scegliere un modello, a testarne le funzionalità e, facoltativamente, a ottimizzare il modello selezionato per la tua applicazione.

Scarica da Kaggle Scarica da Hugging Face

Scegliere un modello

Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti del modello forniscono funzionalità generali o sono specializzate per attività specifiche e sono disponibili in diverse dimensioni dei parametri, in modo che tu possa scegliere un modello con le funzionalità che preferisci e che soddisfi i tuoi requisiti di calcolo.

La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le piattaforme di deployment previste:

Famiglia Gemma 4

L'ultima generazione con input multimodali (testo, immagini, audio).

Dimensioni	Variante	Input ➔ Output	Piattaforma prevista
E2B	Gemma 4 (core)	Testo, immagini, audio ➔ Testo	Dispositivi mobili
E4B	Gemma 4 (core)	Testo, immagini, audio ➔ Testo	Dispositivi mobili e laptop
A4B	Gemma 4 (core)	Testo, immagini ➔ Testo	Computer fissi e server di piccole dimensioni
31B	Gemma 4 (core)	Testo, immagini ➔ Testo	Server di grandi dimensioni o cluster di server

Famiglia Gemma 3 e 3n

Modelli di base per l'elaborazione scalabile di testo e immagini, oltre a varianti "3n" per input multimodali espansi.

Dimensioni	Variante	Input ➔ Output	Piattaforma prevista
270M	Gemma 3 (core)	Testo ➔ Testo	Dispositivi mobili e computer a scheda singola
1B	Gemma 3 (core)	Testo ➔ Testo	Dispositivi mobili e computer a scheda singola
E2B	Gemma 3n	Testo, immagini, audio ➔ Testo	Dispositivi mobili
4B	Gemma 3 (core)	Testo, immagini ➔ Testo	Computer fissi e server di piccole dimensioni
E4B	Gemma 3n	Testo, immagini, audio ➔ Testo	Dispositivi mobili e laptop
12B	Gemma 3 (core)	Testo, immagini ➔ Testo	Computer fissi e server di fascia alta
27B	Gemma 3 (core)	Testo, immagini ➔ Testo	Server di grandi dimensioni o cluster di server

Famiglia Gemma 2

Include modelli di testo standard e le varianti multimodali di visione-linguaggio PaliGemma 2.

Dimensioni	Variante	Input ➔ Output	Piattaforma prevista
2B	Gemma 2 (core)	Testo ➔ Testo	Dispositivi mobili e laptop
3B	PaliGemma 2	Testo, immagini ➔ Testo	Computer fissi e server di piccole dimensioni
9B	Gemma 2 (core)	Testo ➔ Testo	Computer fissi e server di fascia alta
10B	PaliGemma 2	Testo, immagini ➔ Testo	Computer fissi e server di fascia alta
27B	Gemma 2 (core)	Testo ➔ Testo	Server di grandi dimensioni o cluster di server
28B	PaliGemma 2	Testo, immagini ➔ Testo	Server di grandi dimensioni o cluster di server

Famiglia Gemma 1

La generazione originale, incluse le varianti specifiche per la codifica.

Dimensioni	Variante	Input ➔ Output	Piattaforma prevista
2B	Gemma (core) CodeGemma	Testo ➔ Testo	Dispositivi mobili e laptop
7B	Gemma (core) CodeGemma	Testo ➔ Testo	Computer fissi e server di piccole dimensioni

La famiglia di modelli Gemma include anche modelli di ricerca e per scopi speciali, tra cui ShieldGemma, DataGemma, Gemma Scope, e Gemma-APS.

Modelli di test

Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e software di supporto. Poi puoi richiedere al modello di generare testo e valutarne le risposte. Utilizza uno dei seguenti notebook Python con il framework di machine learning che preferisci per configurare un ambiente di test e richiedere a un modello Gemma di generare testo:

Ottimizzare i modelli

Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione. L'ottimizzazione di un modello richiede un set di dati di input e risposte previste di dimensioni e variazioni sufficienti per guidare il comportamento del modello. Per completare un'esecuzione di ottimizzazione sono necessarie anche molte più risorse di calcolo e di memoria rispetto all'esecuzione di un modello Gemma per la generazione di testo. Utilizza uno dei seguenti notebook Python per configurare un ambiente di sviluppo di ottimizzazione e ottimizzare un modello Gemma:

Passaggi successivi

Consulta queste guide per creare altre soluzioni con Gemma: