Execução do código

O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de maneira iterativa com os resultados até chegar a uma saída final. Use esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, é possível usar a execução de código em um aplicativo que resolve equações ou processa textos.

A execução de código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução do código no painel direito, em Ferramentas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois que você adiciona a execução do código como uma ferramenta, o modelo decide quando usá-la.

O ambiente de execução de código inclui as seguintes bibliotecas: altair, chess, cv2, matplotlib, mpmath, numpy, pandas, pdfminer, reportlab, seaborn, sklearn, statsmodels, striprtf, sympy e tabulate. Não é possível instalar suas próprias bibliotecas.

Antes de começar

Antes de chamar a API Gemini, verifique se você tem o SDK de sua escolha instalado e uma chave da API Gemini configurada e pronta para uso.

Começar a usar a execução de código

Entrada/saída (E/S)

A partir do Gemini 2.0 Flash, a execução de código oferece suporte à entrada de arquivos e à saída de gráficos. Usando esses novos recursos de entrada e saída, é possível fazer upload de arquivos CSV e de texto, fazer perguntas sobre os arquivos e gerar gráficos Matplotlib como parte da resposta.

Preços de E/S

Ao usar E/S de execução de código, haverá cobrança por tokens de entrada e tokens de saída:

Tokens de entrada:

  • Comando do usuário

Tokens de saída:

  • Código gerado pelo modelo
  • Saída da execução do código no ambiente de código
  • Resumo gerado pelo modelo

Detalhes de E/S

Ao trabalhar com E/S de execução de código, esteja ciente dos seguintes detalhes técnicos:

  • O ambiente de execução máximo do ambiente de código é de 30 segundos.
  • Se o ambiente do código gerar um erro, o modelo poderá decidir gerar novamente a saída do código. Isso pode acontecer até cinco vezes.
  • O tamanho máximo da entrada do arquivo é limitado pela janela do token do modelo. No AI Studio, usando o Gemini Flash 2.0, o tamanho máximo do arquivo de entrada é de 1 milhão de tokens (aproximadamente 2 MB para arquivos de texto dos tipos de entrada compatíveis). Se você fizer upload de um arquivo muito grande, o AI Studio não permitirá que você o envie.
Interação única Bidirecional (API multimodal em tempo real)
Modelos com suporte Todos os modelos Gemini 2.0 Somente modelos experimentais em Flash
Tipos de entrada de arquivo compatíveis .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts
Bibliotecas de plotagem compatíveis Matplotlib Matplotlib
Uso de várias ferramentas Não Sim

Faturamento

Não há custo extra para ativar a execução de código na API Gemini. Você vai receber cobranças de acordo com a taxa atual de tokens de entrada e saída com base no modelo do Gemini que estiver usando.

Confira algumas outras informações sobre o faturamento para execução de código:

  • Você só é cobrado uma vez pelos tokens de entrada que são transferidos ao modelo e pelos tokens de saída finais retornados pelo modelo.
  • Os tokens que representam o código gerado são contados como tokens de saída. O código gerado pode incluir texto e saída multimodal, como imagens.
  • Os resultados da execução do código também são contados como tokens de saída.

O modelo de faturamento é mostrado no diagrama a seguir:

modelo de faturamento por execução do código

  • A taxa atual de tokens de entrada e saída vai ser cobrada com base no modelo do Gemini que você está usando.
  • Se o Gemini usar a execução de código ao gerar sua resposta, o comando original, o código gerado e o resultado do código executado serão rotulados como tokens intermediários e faturados como tokens de entrada.
  • Em seguida, o Gemini gera um resumo e retorna o código gerado, o resultado do código executado e o resumo final. Eles são faturados como tokens de saída.
  • A API Gemini inclui uma contagem intermediária de tokens na resposta da API. Assim, você sabe por que está recebendo mais tokens de entrada além do seu comando inicial.

Limitações

  • O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
  • Em alguns casos, a ativação da execução de código pode levar a regressões em outras áreas da saída do modelo (por exemplo, na escrita de uma história).
  • Há uma variação na capacidade de diferentes modelos usarem a execução do código com sucesso.