Esecuzione di codice

La funzionalità di esecuzione del codice dell'API Gemini consente al modello di generare ed eseguire codice Python e apprendere iterativamente dai risultati fino a quando non arriva all'output finale. Puoi usare questa funzionalità di esecuzione del codice per creare applicazioni che traggono vantaggio dal ragionamento basato su codice e che producono output di testo. Ad esempio, puoi utilizzare l'esecuzione di codice in un'applicazione che risolve equazioni o elabora il testo.

L'esecuzione del codice è disponibile sia in AI Studio sia nell'API Gemini. In AI Studio, puoi abilitare l'esecuzione del codice nel riquadro a destra in Strumenti. L'API Gemini offre l'esecuzione del codice come strumento, in modo simile alle chiamate di funzione. Dopo aver aggiunto l'esecuzione del codice come strumento, il modello decide quando utilizzarlo.

L'ambiente di esecuzione del codice include le seguenti librerie: altair, chess, cv2, matplotlib, mpmath, numpy, pandas, pdfminer, reportlab, seaborn, sklearn, statsmodels, striprtf, sympy e tabulate. Non puoi installare le tue librerie.

Prima di iniziare

Prima di chiamare l'API Gemini, assicurati di aver installato l'SDK che preferisci e di avere configurato e pronto all'uso una chiave API Gemini.

Iniziare a utilizzare l'esecuzione di codice

Ingresso/uscita (I/O)

A partire da Gemini 2.0 Flash, l'esecuzione del codice supporta l'input di file e l'output di grafici. Utilizzando queste nuove funzionalità di input e output, puoi caricare file CSV e di testo, porre domande sui file e generare grafici Matplotlib come parte della risposta.

Prezzi di I/O

Quando utilizzi l'I/O di esecuzione del codice, ti vengono addebitati i token di input e di output:

Token di input:

  • Prompt dell'utente

Token di output:

  • Codice generato dal modello
  • Output dell'esecuzione del codice nell'ambiente del codice
  • Riepilogo generato dal modello

Dettagli I/O

Quando lavori con l'I/O di esecuzione del codice, tieni presente i seguenti dettagli tecnici:

  • Il runtime massimo dell'ambiente del codice è di 30 secondi.
  • Se l'ambiente del codice genera un errore, il modello può decidere di rigenerare l'output del codice. Questa operazione può verificarsi fino a cinque volte.
  • La dimensione massima dell'inserimento del file è limitata dalla finestra del token del modello. In AI Studio, utilizzando Gemini Flash 2.0, la dimensione massima del file di input è di 1 milione di token (circa 2 MB per i file di testo dei tipi di input supportati). Se carichi un file troppo grande, AI Studio non ti consentirà di inviarlo.
A turno singolo Bidirezionale (API Multimodal Live)
Modelli supportati Tutti i modelli Gemini 2.0 Solo modelli sperimentali Flash
Tipi di input di file supportati .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts
Tracciare le librerie supportate Matplotlib Matplotlib
Utilizzo di più strumenti No

Fatturazione

Non sono previsti costi aggiuntivi per abilitare l'esecuzione del codice dall'API Gemini. Ti verrà addebitata la tariffa attuale dei token di input e di output, in base al modello Gemini in uso.

Ecco alcune altre informazioni da conoscere sulla fatturazione per l'esecuzione di codice:

  • Ti vengono addebitati solo una volta i token di input che passi al modello e i token di output finali che ti vengono restituiti dal modello.
  • I token che rappresentano il codice generato vengono conteggiati come token di output. Il codice generato può includere testo e output multimodale come le immagini.
  • Anche i risultati dell'esecuzione del codice vengono conteggiati come token di output.

Il modello di fatturazione è mostrato nel seguente diagramma:

modello di fatturazione esecuzione del codice

  • Ti viene addebitata la tariffa attuale dei token di input e di output in base al modello Gemini in uso.
  • Se Gemini utilizza l'esecuzione del codice quando genera la risposta, il prompt originale, il codice generato e il risultato del codice eseguito sono etichettati come token intermedi e vengono fatturati come token di input.
  • Gemini genera quindi un riepilogo e restituisce il codice generato, il risultato del codice eseguito e il riassunto finale. Questi vengono fatturati come token di output.
  • L'API Gemini include un conteggio intermedio di token nella risposta dell'API, così sai perché ricevi token di input aggiuntivi oltre al prompt iniziale.

Limitazioni

  • Il modello può solo generare ed eseguire codice. Non può restituire altri elementi come i file multimediali.
  • In alcuni casi, l'attivazione dell'esecuzione di codice può portare a regressioni in altre aree dell'output del modello (ad esempio, la scrittura di una storia).
  • Esistono alcune variazioni nella capacità dei diversi modelli di utilizzare correttamente l'esecuzione del codice.