Questa pagina è stata tradotta dall'API Cloud Translation.

Modelli aperti di Gemma

Una famiglia di modelli aperti, leggeri e all'avanguardia basati sulla stessa ricerca e tecnologia utilizzate per creare i modelli Gemini

Inizia

Responsabile per definizione

Incorporando misure di sicurezza complete, questi modelli aiutano a garantire soluzioni IA responsabili e affidabili attraverso set di dati selezionati e ottimizzazioni rigorose.

Prestazioni ineguagliabili per le dimensioni

I modelli Gemma ottengono risultati di benchmark eccezionali nelle dimensioni 2B e 7B, superando persino alcuni modelli aperti più grandi.

Framework flessibile

Keras 3.0 è compatibile con JAX, TensorFlow e PyTorch e consente di scegliere e cambiare facilmente i framework in base alle attività.

Varianti del modello Gemma

Gemma

I modelli Gemma sono modelli linguistici di grandi dimensioni leggeri, da testo a testo e solo decoder, addestrati su un enorme set di dati di testo, codice e contenuti matematici per una varietà di attività di elaborazione del linguaggio naturale.

Per iniziare

CodeGemma

Sfruttando le basi dei nostri modelli Gemma preaddestrati originali, CodeGemma offre potenti funzionalità di generazione e completamento del codice in dimensioni adatte al computer locale.

Per iniziare

PaliGemma

PaliGemma è un modello di linguaggio visivo aperto progettato per ottimizzare le prestazioni ai massimi livelli di una vasta gamma di attività legate al linguaggio visivo.

Per iniziare

RecurrentGemma

RecurrentGemma è un modello tecnicamente distinto che sfrutta le reti neurali ricorrenti e l'attenzione locale per migliorare l'efficienza della memoria.

Per iniziare

Guide rapide per gli sviluppatori

Scopri le guide rapide su Kaggle

Visita la pagina dei modelli di Kaggle per trovare guide rapide, esempi di codice e discussioni per Gemma.

Apri in Kaggle

Addestramento e deployment su Google Cloud

Gemma funziona al meglio su Google Cloud, con l'ottimizzazione delle TPU end-to-end per prestazioni leader di mercato e costo totale di proprietà su Vertex.

Apri in Vertex AI

Prova l'adattamento di basso livello con JAX tramite Keras 3

Adatta i modelli Gemma al tuo dominio e ai tuoi dati unici con il framework di backend che preferisci tramite Keras 3.

Apri in Colab

Visualizza tutte le guide rapide nella nostra documentazioneVisualizza tutte le guide rapide

Guide rapide per i partner

Hugging Face

Utilizza Hugging Face Transformer e TRL per attività di ottimizzazione e inferenza con i modelli Gemma.

Visualizza su Hugging Face

NVIDIA

Perfeziona i modelli Gemma con il framework NVIDIA NeMo ed esportali in TensorRT-LLM per la produzione.

Visualizza in GitHub

LangChain

Questo tutorial mostra come iniziare a utilizzare Gemma e LangChain in Google Cloud o nel tuo ambiente Colab.

Apri in Colab

Qualsiasi scala

Questi documenti mostrano come utilizzare Gemma tramite Anyscale Endpoint come endpoint API completamente gestiti.

Visualizza su qualsiasi scala

MongoDB

Questo articolo illustra come utilizzare Gemma come modello di base in una pipeline o un sistema di generazione con incremento del recupero.

Visualizza su MongoDB

Ponderazioni e bias

Approfondisci gli strumenti Model Registry e Launch di W&B con un esempio dettagliato utilizzando i modelli Gemma di Google.

Visualizza ponderazioni e bias

Benchmark

Gemma definisce un nuovo standard per prestazioni all’avanguardia per dimensioni rispetto a modelli popolari come Llama 2 e Mistral 7B.

5-colpi, top-1

MMLU

Il benchmark MMLU è un test che misura l'ampiezza delle conoscenze e la capacità di risoluzione dei problemi acquisite dai modelli linguistici di grandi dimensioni durante il preaddestramento.

Tiro 0

HellaSwag

Il benchmark HellaSwag mette in dubbio la capacità di un modello linguistico di comprendere e applicare il ragionamento di buon senso selezionando il finale più logico di una storia.

Tiro 0

PIQA

Il benchmark PIQA testa la capacità di un modello linguistico di comprendere e applicare le conoscenze fisiche del buon senso rispondendo a domande sulle interazioni fisiche quotidiane.

Tiro 0

Il benchmark SIQA valuta la comprensione delle interazioni e del buon senso sociale da parte di un modello linguistico ponendo domande sulle azioni delle persone e sulle loro implicazioni sociali.

Tiro 0

Boolq

Il benchmark BoolQ testa la capacità di un modello linguistico di rispondere a domande sì/no (sì/no) naturali (generate in impostazioni non richieste e non vincolate), testando la capacità del modello di eseguire attività di inferenza del linguaggio naturale nel mondo reale.

punteggio parziale

Winogrande

Il benchmark di Winogrande verifica la capacità di un modello linguistico di risolvere attività ambigue di compilazione del vuoto con opzioni binarie, richiedendo un ragionamento generalizzato del buon senso.

7 tiri

CQA

Il benchmark CQA valuta le prestazioni dei modelli linguistici con domande a scelta multipla, richiedendo diversi tipi di conoscenza del buon senso.

OBQA

Il benchmark OBQA valuta la capacità di un modello linguistico di eseguire risposte avanzate alle domande con ragionamento in più fasi, conoscenza del buon senso e comprensione del testo RTF, modellata dopo esami di libri aperti.

ARC-e

Il benchmark ARC-e verifica le competenze avanzate di risposta alle domande di un modello linguistico con domande scientifiche a scelta multipla del livello scolastico del livello scolastico.

ARC-c

Il benchmark ARC-c è un sottoinsieme più mirato del set di dati ARC-e, contenente solo domande risposte in modo errato da algoritmi comuni (base di recupero e co-occorrenza di parole).

5 tiri

TriviaQA

Il benchmark TriviaQA testa le capacità di comprensione con tripli di domande-risposta e prove.

pass@1

HumanEval

Il benchmark HumanEval testa le capacità di generazione del codice di un modello linguistico valutando se le sue soluzioni superano i test delle unità funzionali per i problemi di programmazione.

3 foto

MBPP

Il benchmark MBPP testa la capacità di un modello linguistico di risolvere problemi di programmazione Python di base, concentrandosi sui concetti fondamentali della programmazione e sull'utilizzo delle librerie standard.

mag@1

GSM8K

Il benchmark GSM8K verifica la capacità di un modello linguistico di risolvere problemi matematici a livello scolastico che spesso richiedono più passaggi di ragionamento.

4-colpi

MATH

Il benchmark MATH valuta la capacità di un modello linguistico di risolvere complessi problemi matematici, richiedendo ragionamento, risoluzione di problemi in più fasi e la comprensione di concetti matematici.

AGIEval

Il benchmark AGIEval testa l'intelligence generale di un modello linguistico utilizzando domande derivate da esami del mondo reale progettati per valutare le capacità intellettuali umane (esami di ammissione al college, esami di legge e così via).

B&B

Il benchmark BBH (BIG-Bench Hard) si concentra sulle attività considerate al di là delle capacità degli attuali modelli linguistici, testando i loro limiti in vari ambiti di ragionamento e comprensione.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma

64,3

Gemma

42,3

Mistral

62,5

LLAMA-2

13b

54,8

LLAMA-2

45,3

Gemma

81,2

Gemma

71,4

Mistral

81,0

LLAMA-2

13b

80,7

LLAMA-2

77,2

Gemma

81,2

Gemma

77,3

Mistral

82,2

LLAMA-2

13b

80,5

LLAMA-2

78,8

Gemma

51,8

Gemma

49,7

Mistral

47,0*

LLAMA-2

13b

50,3

LLAMA-2

48,3

Gemma

83,2

Gemma

69,42

Mistral

83,2*

LLAMA-2

13b

81,7

LLAMA-2

77,4

Gemma

72,3

Gemma

65,4

Mistral

74,2

LLAMA-2

13b

72,8

LLAMA-2

69,2

Gemma

71,3

Gemma

65,3

Mistral

66,3*

LLAMA-2

13b

67,3

LLAMA-2

57,8

Gemma

52,8

Gemma

47,8

Mistral

52,2

LLAMA-2

13b

57,0

LLAMA-2

58,6

Gemma

81,5

Gemma

73,2

Mistral

80,5

LLAMA-2

13b

77,3

LLAMA-2

75,2

Gemma

53,2

Gemma

42,06

Mistral

54,9

LLAMA-2

13b

49,4

LLAMA-2

45,9

Gemma

63,4

Gemma

53,2

Mistral

62,5

LLAMA-2

13b

79,6

LLAMA-2

72,1

Gemma

32,3

Gemma

22.0

Mistral

26,2

LLAMA-2

13b

18,3

LLAMA-2

12,8

Gemma

44,4

Gemma

29,2

Mistral

40,2*

LLAMA-2

13b

30,6

LLAMA-2

20,8

Gemma

46,4

Gemma

17,7

Mistral

35,4*

LLAMA-2

13b

28,7

LLAMA-2

14.6

Gemma

24,3

Gemma

11,8

Mistral

12,7

LLAMA-2

13b

3,9

LLAMA-2

2.5

Gemma

41,7

Gemma

24,2

Mistral

41,2*

LLAMA-2

13b

39,1

LLAMA-2

29,3

Gemma

55,1

Gemma

35,2

Mistral

56,1*

LLAMA-2

13b

39,4

LLAMA-2

32,6

*Consulta il report tecnico per maggiori dettagli sul rendimento con altre metodologie

Leggi il report tecnico

Accedi a Gemma oggi stesso

I modelli Gemma sono disponibili in tutti i tuoi hub dei modelli preferiti.

Modelli Kaggle

Trova i modelli Gemma in molti framework popolari e in una libreria in continua espansione di esempi di codice testati dalla community.

Per iniziare

Model Garden di Vertex AI

Personalizza i modelli Gemma con i tuoi dati, esegui il deployment nelle applicazioni con un solo clic e scala con operazioni ML end-to-end integrate.

Per iniziare

Modelli Hugging Face

Accedi ai modelli Gemma, perfezionali ed eseguine il deployment con Hugging Face Transformer, PEFT e librerie di inferenza per la generazione di testo.

Per iniziare

Sviluppo di un'IA responsabile

Responsabilità per progettazione

Preaddestrati su dati attentamente selezionati e ottimizzati per la sicurezza in alto, contribuendo a potenziare lo sviluppo di un'IA sicura e responsabile basata sui modelli Gemma.

Valutazione solida e trasparente

Valutazioni complete e report trasparenti rivelano i limiti del modello per adottare un approccio responsabile per ogni caso d'uso.

Favorire uno sviluppo responsabile

Il toolkit per l'IA generativa responsabile aiuta gli sviluppatori a progettare e implementare best practice per l'IA responsabile.

Esplora il toolkit dell'IA generativa responsabile

Ottimizzato per Google Cloud

Con i modelli Gemma su Google Cloud, puoi personalizzare profondamente il modello in base alle tue esigenze specifiche con gli strumenti completamente gestiti di Vertex AI o l'opzione autogestita di GKE ed eseguirne il deployment su un'infrastruttura flessibile ed economica ottimizzata per l'IA.

Scopri di più nel blog di Google Cloud

Accelerare la ricerca accademica con i crediti Google Cloud

Il programma di ricerca accademica ha recentemente concluso il periodo di presentazione della domanda, assegnando crediti Google Cloud per supportare i ricercatori che si spingeranno oltre i confini della scoperta scientifica utilizzando i modelli Gemma. Siamo entusiasti di vedere la rivoluzionaria ricerca che emerge da questa iniziativa.

Continua a seguirci per non perderti le opportunità future per migliorare la tua ricerca con Google Cloud.

Unisciti alla community

Connettiti, esplora e condividi le tue conoscenze con gli altri nella community dei modelli ML.

Modelli aperti di Gemma

Responsabile per definizione

Prestazioni ineguagliabili per le dimensioni

Framework flessibile

Varianti del modello Gemma

Gemma

CodeGemma

PaliGemma

RecurrentGemma

Guide rapide per gli sviluppatori

Scopri le guide rapide su Kaggle

Addestramento e deployment su Google Cloud

Prova l'adattamento di basso livello con JAX tramite Keras 3

Guide rapide per i partner

Benchmark

Accedi a Gemma oggi stesso

Sviluppo di un'IA responsabile

Responsabilità per progettazione

Valutazione solida e trasparente

Favorire uno sviluppo responsabile

Ottimizzato per Google Cloud

Accelerare la ricerca accademica con i crediti Google Cloud

Unisciti alla community

Kaggle

Discord

Blog