La famiglia di modelli aperti Gemma include una gamma di dimensioni di modelli, funzionalità e varianti specifiche per le attività per aiutarti a creare soluzioni generative personalizzate. Questi sono i percorsi principali che puoi seguire quando utilizzi i modelli Gemma in un'applicazione:
- Seleziona un modello ed esegui il deployment così com'è nella tua applicazione
- Seleziona un modello, ottimizzalo per un'attività specifica, quindi esegui il deployment in un'applicazione o condividilo con la community.
Questa guida ti aiuta a iniziare con la scelta di un modello, il test delle sue funzionalità e, facoltativamente, l'ottimizzazione del modello selezionato per la tua applicazione.
Scegli un modello
Questa sezione ti aiuta a comprendere le varianti ufficiali della famiglia di modelli Gemma e a selezionare un modello per la tua applicazione. Le varianti di modello offrono capacità generali o sono specializzate per attività specifiche e sono fornite in parametri di dimensioni diverse in modo da poter scegliere un modello con le funzionalità preferite e che soddisfi i requisiti di calcolo.
Elenco modelli Gemma
Nella tabella seguente sono elencate le varianti principali della famiglia di modelli Gemma e le relative funzionalità di alto livello:
Dimensione parametro | Ingresso | Uscita | Architettura | Varianti | Piattaforme di destinazione |
---|---|---|---|---|---|
B2 | Testo | Testo | Gemma 1 | Dispositivi mobili e laptop | |
3 MLD | Testo, immagini | Testo | Gemma 1 | Dispositivi mobili e laptop | |
7 MLD | Testo | Testo | Gemma 1 | Computer desktop e piccoli server | |
Oltre 9 miliardi | Testo | Testo | Computer e server desktop di fascia alta | ||
27 MLD | Testo | Testo | Gemma 2 | Server o cluster di server di grandi dimensioni |
Puoi scaricare tutte le varianti ufficiali del modello Gemma da Kaggle Models.
Testa i modelli
Puoi testare i modelli Gemma configurando un ambiente di sviluppo con un modello scaricato e un software di supporto. Puoi quindi richiedere al modello e valutare le sue risposte. Usa uno dei seguenti blocchi note Python con il tuo framework di machine learning preferito per configurare un ambiente di test e generare un prompt per un modello Gemma:
Testa Gemma 2 in AI Studio
Puoi testare rapidamente Gemma 2 senza configurare un ambiente di sviluppo utilizzando Google AI Studio. Questa applicazione web ti consente di provare i prompt con Gemma 2 e valutarne le funzionalità.
Per provare Gemma 2 in Google AI Studio:
Apri AI Studio.
Nel riquadro Impostazioni di esecuzione a destra, nel campo Modello, seleziona un modello Gemma 2.
Nella parte inferiore del riquadro centrale, digita un prompt e seleziona Esegui.
Per ulteriori informazioni sull'utilizzo di AI Studio, consulta la guida rapida di Google AI Studio.
Ottimizzare i modelli
Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione sui modelli. L'ottimizzazione di un modello richiede un set di dati degli input e delle risposte previste di dimensioni e variazioni sufficienti per guidare il comportamento del modello. Inoltre, per completare un'esecuzione di ottimizzazione hai bisogno di risorse di elaborazione e memoria notevolmente superiori rispetto all'esecuzione di un modello Gemma per la generazione del testo. Utilizza uno dei seguenti blocchi note Python per configurare un ambiente di sviluppo dell'ottimizzazione e ottimizzare un modello Gemma:
- Ottimizzare Gemma con l'ottimizzazione di Keras e LoRA
- Ascolta Gemma con JAX
- Ottimizza i modelli Gemma più grandi con l'addestramento distribuito
Passaggi successivi
Dai un'occhiata a queste guide per creare altre soluzioni con Gemma: