Inizia a utilizzare i modelli Gemma

La famiglia di modelli open Gemma include una gamma di dimensioni, funzionalità e varianti specializzate per attività per aiutarti a creare soluzioni generative personalizzate. Questi sono i principali percorsi che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:

  • Seleziona un modello e esegui il deployment così com'è nella tua applicazione
  • Seleziona un modello, ottimizzalo per un'attività specifica e poi esegui il deployment in un'applicazione o condividilo con la community.

Questa guida ti aiuta a iniziare a scegliere un modello, a testarne le funzionalità e, facoltativamente, a ottimizzare il modello selezionato per la tua applicazione.

Scarica da Kaggle Scarica da Hugging Face

Scegliere un modello

Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti del modello forniscono funzionalità generali o sono specializzate per attività specifiche e sono disponibili in diverse dimensioni dei parametri, in modo che tu possa scegliere un modello con le funzionalità che preferisci e che soddisfi i tuoi requisiti di calcolo.

La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le piattaforme di deployment previste:

Famiglia Gemma 4

L'ultima generazione con input multimodali (testo, immagini, audio).

Dimensioni Variante Input ➔ Output Piattaforma prevista
E2B Gemma 4 (core) Testo, immagini, audio ➔ Testo Dispositivi mobili
E4B Gemma 4 (core) Testo, immagini, audio ➔ Testo Dispositivi mobili e laptop
A4B Gemma 4 (core) Testo, immagini ➔ Testo Computer fissi e server di piccole dimensioni
31B Gemma 4 (core) Testo, immagini ➔ Testo Server di grandi dimensioni o cluster di server

Famiglia Gemma 3 e 3n

Modelli di base per l'elaborazione scalabile di testo e immagini, oltre a varianti "3n" per input multimodali espansi.

Dimensioni Variante Input ➔ Output Piattaforma prevista
270M Gemma 3 (core) Testo ➔ Testo Dispositivi mobili e computer a scheda singola
1B Gemma 3 (core) Testo ➔ Testo Dispositivi mobili e computer a scheda singola
E2B Gemma 3n Testo, immagini, audio ➔ Testo Dispositivi mobili
4B Gemma 3 (core) Testo, immagini ➔ Testo Computer fissi e server di piccole dimensioni
E4B Gemma 3n Testo, immagini, audio ➔ Testo Dispositivi mobili e laptop
12B Gemma 3 (core) Testo, immagini ➔ Testo Computer fissi e server di fascia alta
27B Gemma 3 (core) Testo, immagini ➔ Testo Server di grandi dimensioni o cluster di server

Famiglia Gemma 2

Include modelli di testo standard e le varianti multimodali di visione-linguaggio PaliGemma 2.

Dimensioni Variante Input ➔ Output Piattaforma prevista
2B Gemma 2 (core) Testo ➔ Testo Dispositivi mobili e laptop
3B PaliGemma 2 Testo, immagini ➔ Testo Computer fissi e server di piccole dimensioni
9B Gemma 2 (core) Testo ➔ Testo Computer fissi e server di fascia alta
10B PaliGemma 2 Testo, immagini ➔ Testo Computer fissi e server di fascia alta
27B Gemma 2 (core) Testo ➔ Testo Server di grandi dimensioni o cluster di server
28B PaliGemma 2 Testo, immagini ➔ Testo Server di grandi dimensioni o cluster di server

Famiglia Gemma 1

La generazione originale, incluse le varianti specifiche per la codifica.

Dimensioni Variante Input ➔ Output Piattaforma prevista
2B Gemma (core)
CodeGemma
Testo ➔ Testo Dispositivi mobili e laptop
7B Gemma (core)
CodeGemma
Testo ➔ Testo Computer fissi e server di piccole dimensioni

La famiglia di modelli Gemma include anche modelli di ricerca e per scopi speciali, tra cui ShieldGemma, DataGemma, Gemma Scope, e Gemma-APS.

Modelli di test

Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e software di supporto. Poi puoi richiedere al modello di generare testo e valutarne le risposte. Utilizza uno dei seguenti notebook Python con il framework di machine learning che preferisci per configurare un ambiente di test e richiedere a un modello Gemma di generare testo:

Ottimizzare i modelli

Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione. L'ottimizzazione di un modello richiede un set di dati di input e risposte previste di dimensioni e variazioni sufficienti per guidare il comportamento del modello. Per completare un'esecuzione di ottimizzazione sono necessarie anche molte più risorse di calcolo e di memoria rispetto all'esecuzione di un modello Gemma per la generazione di testo. Utilizza uno dei seguenti notebook Python per configurare un ambiente di sviluppo di ottimizzazione e ottimizzare un modello Gemma:

Passaggi successivi

Consulta queste guide per creare altre soluzioni con Gemma: