La famiglia di modelli aperti Gemma include un'ampia gamma di dimensioni, funzionalità, e varianti specifiche per le attività, per aiutarti a creare soluzioni generative personalizzate. Questi sono i percorsi principali che puoi seguire quando utilizzi i modelli Gemma in una applicazione:
- Seleziona un modello ed esegui il deployment così com'è nella tua applicazione
- Seleziona un modello, ottimizzalo per un'attività specifica, quindi esegui il deployment in un'applicazione o condividerlo con la community.
Questa guida ti aiuta a iniziare con la scelta di un modello e il test delle sue funzionalità e, facoltativamente, di ottimizzare il modello selezionato la tua applicazione.
Scegli un modello
Questa sezione ti aiuta a comprendere le varianti ufficiali del modello Gemma famiglia e seleziona un modello per la tua applicazione. Le varianti del modello offrono capacità generali o sono specializzati per attività specifiche e sono forniti con parametri di dimensioni diverse, in modo da poter scegliere il modello che di archiviazione e soddisfa i requisiti di calcolo.
Elenco modelli Gemma
La tabella seguente elenca le principali varianti della famiglia di modelli Gemma e le relative piattaforme di deployment previste:
Dimensione parametro | Ingresso | Output | Architettura | Varianti | Piattaforme di destinazione |
---|---|---|---|---|---|
2B | Testo | Testo | Gemma 2 | Dispositivi mobili e laptop | |
Gemma 1 | |||||
3 MLD | Testo, immagini | Testo | Gemma 1 | Dispositivi mobili e laptop | |
7 MLD | Testo | Testo | Gemma 1 | Computer desktop e piccoli server | |
Oltre 9 miliardi | Testo | Testo | Gemma 2 | Computer e server desktop di fascia alta | |
Gemma 1 | |||||
27 MLD | Testo | Testo | Gemma 2 | Server o cluster di server di grandi dimensioni |
Puoi scaricare tutte le varianti ufficiali del modello Gemma da Modelli Kaggle.
Testa i modelli
Puoi testare i modelli Gemma configurando un ambiente di sviluppo con una il modello scaricato e il software di supporto. Puoi quindi richiedere al modello valutarne le risposte. Usa uno dei seguenti blocchi note Python con il framework di machine learning preferito per configurare un ambiente di test e un prompt un modello di Gemma:
Testa Gemma 2 in AI Studio
Puoi testare rapidamente Gemma 2 senza configurare un ambiente di sviluppo utilizzando Google AI Studio. Questa applicazione web ti consente di provare i prompt con Gemma 2 e valutarne le capacità.
Per provare Gemma 2 in Google AI Studio:
Apri AI Studio.
Nel riquadro Impostazioni di esecuzione a destra, nel campo Modello, seleziona un modello Gemma 2.
Nella parte inferiore del riquadro centrale, digita un prompt e seleziona Esegui.
Per ulteriori informazioni sull'utilizzo di AI Studio, consulta Guida rapida di Google AI Studio.
Ottimizzare i modelli
Puoi modificare il comportamento dei modelli Gemma eseguendo l'ottimizzazione sui modelli. Ottimizzazione un modello richiede un set di dati di input e risposte previste di dimensioni sufficienti e variazione per guidare il comportamento del modello. Inoltre, devi avere di risorse di computing e memoria in più per completare un'esecuzione di ottimizzazione rispetto all'esecuzione un modello Gemma per la generazione del testo. Usa uno dei seguenti blocchi note Python per configura un ambiente di sviluppo per l'ottimizzazione e ottimizza un modello Gemma:
- Ottimizzare Gemma con l'ottimizzazione di Keras e LoRA
- Ascolta Gemma con JAX
- Ottimizza i modelli Gemma più grandi con l'addestramento distribuito
Passaggi successivi
Dai un'occhiata a queste guide per creare altre soluzioni con Gemma: