Esecuzione del codice

La funzionalità di esecuzione del codice dell'API Gemini consente al modello di generare ed eseguire codice Python e apprendere iterativamente dai risultati fino a quando non arriva all'output finale. Puoi usare questa funzionalità di esecuzione del codice per creare applicazioni che traggono vantaggio dal ragionamento basato su codice e che producono output di testo. Ad esempio, potresti utilizzare l'esecuzione del codice in un'applicazione che risolve equazioni o elabora il testo.

L'esecuzione del codice è disponibile sia in AI Studio sia nell'API Gemini. In AI Studio, puoi abilitare l'esecuzione del codice in Impostazioni avanzate. L'API Gemini offre l'esecuzione del codice come strumento, in modo simile alle chiamate di funzione. Dopo aver aggiunto l'esecuzione del codice come strumento, il modello decide quando utilizzarlo.

Inizia a utilizzare l'esecuzione del codice

Visualizza su ai.google.dev Esegui in Google Colab Visualizza il codice sorgente su GitHub

Questa sezione presuppone che tu abbia installato un SDK Gemini e configurato una chiave API, come mostrato nella quickstart.

Esecuzione di codice e chiamata di funzione a confronto

L'esecuzione del codice e le chiamate di funzione sono caratteristiche simili:

  • L'esecuzione del codice consente al modello di eseguire il codice nel backend dell'API in un ambiente isolato fisso.
  • Le chiamate di funzione ti consentono di eseguire le funzioni richieste dal modello, in qualsiasi ambiente.

In generale, dovresti preferire l'esecuzione del codice se è in grado di gestire il tuo caso d'uso. L'esecuzione del codice è più semplice da usare (devi solo abilitarla) e si risolve in una singola richiesta GenerateContent (con un unico addebito). La chiamata di funzione riceve una richiesta GenerateContent aggiuntiva per inviare l'output da ogni chiamata di funzione (l'operazione comporta quindi più addebiti).

Nella maggior parte dei casi, è consigliabile utilizzare le chiamate di funzione se hai funzioni da eseguire localmente e dovresti utilizzare l'esecuzione del codice se vuoi che l'API scriva ed esegua codice Python per te e restituisca il risultato.

Fatturazione

Non sono previsti costi aggiuntivi per abilitare l'esecuzione del codice dall'API Gemini. Ti verrà addebitata la tariffa attuale per i token di input e output.

Di seguito sono riportate altre informazioni importanti sulla fatturazione per l'esecuzione del codice:

  • Ti vengono addebitati solo una volta i token di input che passi al modello e i token di output finali che ti vengono restituiti dal modello.
  • I token che rappresentano il codice generato vengono conteggiati come token di output.
  • Anche i risultati dell'esecuzione del codice vengono conteggiati come token di output.

Limitazioni

  • Il modello può solo generare ed eseguire codice. Non può restituire altri artefatti come i file multimediali.
  • La funzionalità non supporta l'I/O dei file o i casi d'uso che coinvolgono output non testuali (ad esempio, i grafici di dati).
  • L'esecuzione del codice può essere eseguita per un massimo di 30 secondi prima del timeout.
  • In alcuni casi, l'abilitazione dell'esecuzione del codice può portare a regressioni in altre aree dell'output del modello (ad esempio, la scrittura di una storia).
  • Esistono alcune variazioni nella capacità dei diversi modelli di utilizzare correttamente l'esecuzione del codice. Sulla base dei nostri test, Gemini 1.5 Pro è il modello più performante.