O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de forma iterativa com os resultados até chegar a uma saída final. Use esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, é possível usar a execução de código em um aplicativo que resolva equações ou processe texto.
A execução de código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução de código em Configurações avançadas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois que você adiciona a execução do código como uma ferramenta, o modelo decide quando usá-la.
Introdução à execução de código
Ver em ai.google.dev | Executar no Google Colab | Veja o código-fonte no GitHub |
Esta seção pressupõe que você instalou um SDK do Gemini e configurou uma chave de API, conforme mostrado no quickstart.
Execução de código versus chamada de função
A execução de código e a chamada de função são recursos semelhantes:
- Com a execução de código, o modelo executa o código no back-end da API em um ambiente fixo e isolado.
- Com a chamada de função, é possível executar as funções solicitadas pelo modelo em qualquer ambiente que você quiser.
Em geral, prefira usar a execução de código se ela puder processar seu caso
de uso. A execução de código é mais simples de usar (basta ativá-la) e é resolvida em uma
única solicitação GenerateContent
, incorrendo assim uma única cobrança. A chamada
de função usa uma solicitação GenerateContent
extra para enviar a saída
de cada chamada de função, gerando várias cobranças.
Na maioria dos casos, use a chamada de função se você tiver suas próprias funções que quer executar localmente e use a execução de código se quiser que a API grave e execute o código Python para você e retorne o resultado.
Faturamento
Não há custo extra para ativar a execução de código na API Gemini. A cobrança será feita de acordo com a taxa atual de tokens de entrada e saída.
Confira outras informações importantes sobre o faturamento da execução de código:
- Você só será cobrado uma vez pelos tokens de entrada que forem transferidos ao modelo e pelos tokens de saída finais retornados pelo modelo.
- Os tokens que representam o código gerado são contados como tokens de saída.
- Os resultados da execução do código também são contados como tokens de saída.
Limitações
- O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
- O recurso não oferece suporte a E/S de arquivos ou casos de uso que envolvam saída não textual, por exemplo, gráficos de dados.
- A execução do código pode ser executada por no máximo 30 segundos antes de expirar.
- Em alguns casos, ativar a execução do código pode levar a regressões em outras áreas de saída do modelo (por exemplo, escrever uma história).
- Há uma variação na capacidade de diferentes modelos usarem a execução do código com sucesso. Com base em nossos testes, o Gemini 1.5 Pro é o modelo com melhor desempenho.