La famiglia di modelli open Gemma include una gamma di dimensioni, funzionalità e varianti specializzate per attività per aiutarti a creare soluzioni generative personalizzate. Questi sono i principali percorsi che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:
- Seleziona un modello e esegui il deployment così com'è nella tua applicazione
- Seleziona un modello, ottimizzalo per un'attività specifica e poi esegui il deployment in un'applicazione o condividilo con la community.
Questa guida ti aiuta a iniziare a scegliere un modello, a testarne le funzionalità e, facoltativamente, a ottimizzare il modello selezionato per la tua applicazione.
Scarica da Kaggle Scarica da Hugging Face
Scegliere un modello
Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti del modello forniscono funzionalità generali o sono specializzate per attività specifiche e sono disponibili in diverse dimensioni dei parametri, in modo che tu possa scegliere un modello con le funzionalità che preferisci e che soddisfi i tuoi requisiti di calcolo.
La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le piattaforme di deployment previste:
Famiglia Gemma 4
L'ultima generazione con input multimodali (testo, immagini, audio).
| Dimensioni | Variante | Input ➔ Output | Piattaforma prevista |
|---|---|---|---|
| E2B | Gemma 4 (core) | Testo, immagini, audio ➔ Testo | Dispositivi mobili |
| E4B | Gemma 4 (core) | Testo, immagini, audio ➔ Testo | Dispositivi mobili e laptop |
| A4B | Gemma 4 (core) | Testo, immagini ➔ Testo | Computer fissi e server di piccole dimensioni |
| 31B | Gemma 4 (core) | Testo, immagini ➔ Testo | Server di grandi dimensioni o cluster di server |
Famiglia Gemma 3 e 3n
Modelli di base per l'elaborazione scalabile di testo e immagini, oltre a varianti "3n" per input multimodali espansi.
| Dimensioni | Variante | Input ➔ Output | Piattaforma prevista |
|---|---|---|---|
| 270M | Gemma 3 (core) | Testo ➔ Testo | Dispositivi mobili e computer a scheda singola |
| 1B | Gemma 3 (core) | Testo ➔ Testo | Dispositivi mobili e computer a scheda singola |
| E2B | Gemma 3n | Testo, immagini, audio ➔ Testo | Dispositivi mobili |
| 4B | Gemma 3 (core) | Testo, immagini ➔ Testo | Computer fissi e server di piccole dimensioni |
| E4B | Gemma 3n | Testo, immagini, audio ➔ Testo | Dispositivi mobili e laptop |
| 12B | Gemma 3 (core) | Testo, immagini ➔ Testo | Computer fissi e server di fascia alta |
| 27B | Gemma 3 (core) | Testo, immagini ➔ Testo | Server di grandi dimensioni o cluster di server |
Famiglia Gemma 2
Include modelli di testo standard e le varianti multimodali di visione-linguaggio PaliGemma 2.
| Dimensioni | Variante | Input ➔ Output | Piattaforma prevista |
|---|---|---|---|
| 2B | Gemma 2 (core) | Testo ➔ Testo | Dispositivi mobili e laptop |
| 3B | PaliGemma 2 | Testo, immagini ➔ Testo | Computer fissi e server di piccole dimensioni |
| 9B | Gemma 2 (core) | Testo ➔ Testo | Computer fissi e server di fascia alta |
| 10B | PaliGemma 2 | Testo, immagini ➔ Testo | Computer fissi e server di fascia alta |
| 27B | Gemma 2 (core) | Testo ➔ Testo | Server di grandi dimensioni o cluster di server |
| 28B | PaliGemma 2 | Testo, immagini ➔ Testo | Server di grandi dimensioni o cluster di server |
Famiglia Gemma 1
La generazione originale, incluse le varianti specifiche per la codifica.
| Dimensioni | Variante | Input ➔ Output | Piattaforma prevista |
|---|---|---|---|
| 2B | Gemma (core) CodeGemma |
Testo ➔ Testo | Dispositivi mobili e laptop |
| 7B | Gemma (core) CodeGemma |
Testo ➔ Testo | Computer fissi e server di piccole dimensioni |
La famiglia di modelli Gemma include anche modelli di ricerca e per scopi speciali, tra cui ShieldGemma, DataGemma, Gemma Scope, e Gemma-APS.
Modelli di test
Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e software di supporto. Poi puoi richiedere al modello di generare testo e valutarne le risposte. Utilizza uno dei seguenti notebook Python con il framework di machine learning che preferisci per configurare un ambiente di test e richiedere a un modello Gemma di generare testo:
Ottimizzare i modelli
Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione. L'ottimizzazione di un modello richiede un set di dati di input e risposte previste di dimensioni e variazioni sufficienti per guidare il comportamento del modello. Per completare un'esecuzione di ottimizzazione sono necessarie anche molte più risorse di calcolo e di memoria rispetto all'esecuzione di un modello Gemma per la generazione di testo. Utilizza uno dei seguenti notebook Python per configurare un ambiente di sviluppo di ottimizzazione e ottimizzare un modello Gemma:
- Ottimizzare Gemma con Keras e l'ottimizzazione LoRA
- Ottimizzare i modelli Gemma più grandi con l'addestramento distribuito
Passaggi successivi
Consulta queste guide per creare altre soluzioni con Gemma: