La famiglia di modelli aperti Gemma include una gamma di dimensioni, funzionalità e varianti specializzate per le attività per aiutarti a creare soluzioni generative personalizzate. Di seguito sono riportati i percorsi principali che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:
- Seleziona un modello ed eseguine il deployment così com'è nella tua applicazione
- Seleziona un modello, ottimalizalo per un'attività specifica, quindi esegui il deployment in un'applicazione o condividilo con la community.
Questa guida ti aiuta a iniziare a scegliere un modello, a testarne le funzionalità e, facoltativamente, a ottimizzare il modello selezionato per la tua applicazione.
Prova Gemma 3 Scaricalo su Kaggle Scaricalo su Hugging Face
Scegli un modello
Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti del modello forniscono funzionalità generali o sono specializzate per attività specifiche e sono disponibili in dimensioni di parametri diverse, in modo da poter scegliere un modello con le funzionalità che preferisci e che soddisfi i tuoi requisiti di calcolo.
Elenco dei modelli Gemma
La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le relative piattaforme di deployment previste:
Dimensioni del parametro | Ingresso | Output | Variante | Foundation | Piattaforme previste |
---|---|---|---|---|---|
1 MLD | Testo | Testo | Gemma 3 | Dispositivi mobili e computer a scheda singola | |
2B | Testo | Testo | Gemma 2 | Dispositivi mobili e laptop | |
Gemma 1 | |||||
3 mld | Testo, immagini | Testo | Gemma 2 | Computer desktop e piccoli server | |
4 MLD | Testo, immagini | Testo | Gemma 3 | Computer desktop e piccoli server | |
7 miliardi | Testo | Testo | Gemma 1 | Computer desktop e piccoli server | |
Oltre 9 miliardi | Testo | Testo | Gemma 2 | Computer e server di fascia più alta | |
10 MLD | Testo, immagini | Testo | Gemma 2 | Computer e server di fascia più alta | |
12 mld | Testo, immagini | Testo | Gemma 3 | Computer e server di fascia più alta | |
27 mld | Testo, immagini | Testo | Gemma 3 | Server o cluster di server di grandi dimensioni | |
Testo | Testo | Gemma 2 | |||
28 MLD | Testo, immagini | Testo | Gemma 2 | Server o cluster di server di grandi dimensioni |
La famiglia di modelli Gemma include anche modelli per scopi speciali e di ricerca, tra cui ShieldGemma, DataGemma, Gemma Scope e Gemma-APS.
Modelli di test
Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e il software di supporto. Puoi quindi chiedere al modello di rispondere e valutarne le risposte. Utilizza uno dei seguenti notebook Python con il tuo framework di machine learning preferito per configurare un ambiente di test e richiedere un modello Gemma:
Testare Gemma 3 in AI Studio
Puoi testare rapidamente Gemma senza configurare un ambiente di sviluppo utilizzando Google AI Studio. Questa applicazione web ti consente di provare i prompt con Gemma e di valutarne le funzionalità.
Per provare Gemma 3 in Google AI Studio:
Apri AI Studio.
Nel riquadro Impostazioni esecuzione a destra, nel campo Modello, seleziona un modello Gemma di dimensioni diverse.
Nella parte inferiore del riquadro centrale, digita un prompt e seleziona Esegui.
Per ulteriori informazioni sull'utilizzo di AI Studio, consulta la guida rapida di Google AI Studio.
Ottimizzare i modelli
Puoi modificare il comportamento dei modelli Gemma eseguendo la loro ottimizzazione. L'ottimizzazione di un modello richiede un set di dati di input e risposte previste di dimensioni sufficientemente grandi e con una variazione sufficiente per guidare il comportamento del modello. Inoltre, sono necessarie risorse di calcolo e memoria molto maggiori per completare una corsa di ottimizzazione rispetto all'esecuzione di un modello Gemma per la generazione di testo. Utilizza uno dei seguenti notebook Python per configurare un ambiente di sviluppo per l'ottimizzazione e ottimizzare un modello Gemma:
- Ottimizzare Gemma con l'ottimizzazione di Keras e LoRA
- Ottimizzare modelli Gemma più grandi con l'addestramento distribuito
Passaggi successivi
Consulta queste guide per creare altre soluzioni con Gemma: