O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de forma iterativa com os resultados até chegar a uma saída final. É possível usar esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, você pode usar a execução de código em um aplicativo que resolve equações ou processa texto.
A execução do código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução do código em Configurações avançadas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois de adicionar a execução de código como uma ferramenta, o modelo decide quando usá-la.
Começar a usar a execução de código
Esta seção pressupõe que você concluiu as etapas de instalação e configuração mostradas no guia de início rápido.
Execução de código versus chamada de função
A execução de código e a chamada de função são recursos semelhantes:
- A execução de código permite que o modelo execute código no back-end da API em um ambiente fixo e isolado.
- A chamada de função permite executar as funções solicitadas pelo modelo em qualquer ambiente.
Em geral, é recomendável usar a execução de código se ela puder lidar com seu caso de uso. A execução do código é mais simples de usar (basta ativá-la) e é resolvida em uma
única solicitação GenerateContent
, o que gera uma única cobrança. A chamada de
função usa uma solicitação GenerateContent
adicional para enviar a saída
de cada chamada de função, o que gera várias cobranças.
Na maioria dos casos, use a chamada de função se você tiver suas próprias funções que quer executar localmente. Use a execução de código se quiser que a API escreva e execute o código Python para você e retorne o resultado.
Faturamento
Não há cobrança extra para ativar a execução de código na API Gemini. A cobrança será feita com base na taxa atual de tokens de entrada e saída.
Confira algumas outras informações sobre o faturamento para execução de código:
- Você só vai receber cobranças uma vez pelos tokens de entrada que transmitir ao modelo e pelos tokens de saída finais retornados pelo modelo.
- Os tokens que representam o código gerado são contados como tokens de saída.
- Os resultados da execução do código também são contados como tokens de saída.
Limitações
- O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
- O recurso não oferece suporte a E/S de arquivos ou casos de uso que envolvem saídas que não sejam de texto, como gráficos de dados ou um upload de arquivo CSV.
- A execução do código pode durar no máximo 30 segundos antes do tempo limite.
- Em alguns casos, a ativação da execução de código pode levar a regressões em outras áreas da saída do modelo (por exemplo, na escrita de uma história).
- Há alguma variação na capacidade dos diferentes modelos de usar a execução do código com sucesso. O Gemini 1.5 Pro é o modelo com melhor desempenho com base nos nossos testes.