La famiglia di modelli aperti Gemma include una gamma di dimensioni, funzionalità e varianti specializzate per attività per aiutarti a creare soluzioni generative personalizzate. Di seguito sono riportati i percorsi principali che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:
- Seleziona un modello ed esegui il deployment così com'è nella tua applicazione
- Seleziona un modello, ottimizzalo per un'attività specifica e poi esegui il deployment in un'applicazione o condividilo con la community.
Questa guida ti aiuta a iniziare a scegliere un modello, a testarne le funzionalità e, facoltativamente, a ottimizzare il modello selezionato per la tua applicazione.
Scarica da Kaggle Scarica da Hugging Face
Scegliere un modello
Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti del modello forniscono funzionalità generali o sono specializzate per attività specifiche e sono disponibili in diverse dimensioni dei parametri, in modo da poter scegliere un modello con le funzionalità che preferisci e che soddisfi i tuoi requisiti di calcolo.
Elenco dei modelli Gemma
La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le piattaforme di deployment previste:
| Dimensioni del parametro | Ingresso | Output | Variante | Foundation | Piattaforme previste |
|---|---|---|---|---|---|
| 270 mln | Testo | Testo | Gemma 3 | Dispositivi mobili e computer a scheda singola | |
| 1 MLD | Testo | Testo | Gemma 3 | Dispositivi mobili e computer a scheda singola | |
| E2B | Testo, immagini, audio | Testo | Gemma 3n | Dispositivi mobili | |
| 2B | Testo | Testo | Gemma 2 | Dispositivi mobili e laptop | |
| Gemma 1 | |||||
| 3 mld | Testo, immagini | Testo | Gemma 2 | Computer desktop e server di piccole dimensioni | |
| E4B | Testo, immagini, audio | Testo | Gemma 3n | Dispositivi mobili e laptop | |
| 4B | Testo, immagini | Testo | Gemma 3 | Computer desktop e server di piccole dimensioni | |
| 7B | Testo | Testo | Gemma 1 | Computer desktop e server di piccole dimensioni | |
| Oltre 9 miliardi | Testo | Testo | Gemma 2 | Computer desktop e server di fascia alta | |
| 10 MLD | Testo, immagini | Testo | Gemma 2 | Computer desktop e server di fascia alta | |
| 12 mld | Testo, immagini | Testo | Gemma 3 | Computer desktop e server di fascia alta | |
| 27B | Testo, immagini | Testo | Gemma 3 | Server o cluster di server di grandi dimensioni | |
| Testo | Testo | Gemma 2 | |||
| 28 MLD | Testo, immagini | Testo | Gemma 2 | Server o cluster di server di grandi dimensioni |
La famiglia di modelli Gemma include anche modelli per scopi speciali e di ricerca, tra cui ShieldGemma, DataGemma, Gemma Scope, e Gemma-APS.
Modelli di test
Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e un software di supporto. Puoi quindi richiedere al modello di valutare le sue risposte. Utilizza uno dei seguenti notebook Python con il tuo framework di machine learning preferito per configurare un ambiente di test e richiedere un modello Gemma:
Ottimizzare i modelli
Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione. L'ottimizzazione di un modello richiede un set di dati di input e risposte previste di dimensioni e variazione sufficienti per guidare il comportamento del modello. Inoltre, per completare una sessione di ottimizzazione sono necessarie molte più risorse di calcolo e memoria rispetto all'esecuzione di un modello Gemma per la generazione di testo. Utilizza uno dei seguenti notebook Python per configurare un ambiente di sviluppo di ottimizzazione e ottimizzare un modello Gemma:
- Ottimizzare Gemma con Keras e l'ottimizzazione LoRA
- Ottimizzare i modelli Gemma più grandi con l'addestramento distribuito
Passaggi successivi
Consulta queste guide per creare altre soluzioni con Gemma: