Execução de código

O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de forma iterativa com os resultados até chegar a uma saída final. Use esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, é possível usar a execução de código em um aplicativo que resolva equações ou processe texto.

A execução de código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução de código em Configurações avançadas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois que você adiciona a execução do código como uma ferramenta, o modelo decide quando usá-la.

Introdução à execução de código

Ver em ai.google.dev Executar no Google Colab Veja o código-fonte no GitHub

Esta seção pressupõe que você instalou um SDK do Gemini e configurou uma chave de API, conforme mostrado no quickstart.

Execução de código versus chamada de função

A execução de código e a chamada de função são recursos semelhantes:

  • Com a execução de código, o modelo executa o código no back-end da API em um ambiente fixo e isolado.
  • Com a chamada de função, é possível executar as funções solicitadas pelo modelo em qualquer ambiente que você quiser.

Em geral, prefira usar a execução de código se ela puder processar seu caso de uso. A execução de código é mais simples de usar (basta ativá-la) e é resolvida em uma única solicitação GenerateContent, incorrendo assim uma única cobrança. A chamada de função usa uma solicitação GenerateContent extra para enviar a saída de cada chamada de função, gerando várias cobranças.

Na maioria dos casos, use a chamada de função se você tiver suas próprias funções que quer executar localmente e use a execução de código se quiser que a API grave e execute o código Python para você e retorne o resultado.

Faturamento

Não há custo extra para ativar a execução de código na API Gemini. A cobrança será feita de acordo com a taxa atual de tokens de entrada e saída.

Confira outras informações importantes sobre o faturamento da execução de código:

  • Você só será cobrado uma vez pelos tokens de entrada que forem transferidos ao modelo e pelos tokens de saída finais retornados pelo modelo.
  • Os tokens que representam o código gerado são contados como tokens de saída.
  • Os resultados da execução do código também são contados como tokens de saída.

Limitações

  • O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
  • O recurso não oferece suporte a E/S de arquivos ou casos de uso que envolvam saída não textual, por exemplo, gráficos de dados.
  • A execução do código pode ser executada por no máximo 30 segundos antes de expirar.
  • Em alguns casos, ativar a execução do código pode levar a regressões em outras áreas de saída do modelo (por exemplo, escrever uma história).
  • Há uma variação na capacidade de diferentes modelos usarem a execução do código com sucesso. Com base em nossos testes, o Gemini 1.5 Pro é o modelo com melhor desempenho.