O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de forma iterativa com os resultados até chegar a uma saída final. É possível usar esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, você pode usar a execução de código em um aplicativo que resolve equações ou processa texto.
A execução do código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução de código no painel à direita em Ferramentas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois de adicionar a execução de código como uma ferramenta, o modelo decide quando usá-la.
O ambiente de execução de código inclui as seguintes bibliotecas:
altair
, chess
, cv2
, matplotlib
, mpmath
, numpy
, pandas
,
pdfminer
, reportlab
, seaborn
, sklearn
, statsmodels
, striprtf
,
sympy
e tabulate
. Não é possível instalar suas próprias bibliotecas.
Começar a usar a execução de código
Esta seção pressupõe que você concluiu as etapas de instalação e configuração mostradas no guia de início rápido.
Entrada/saída (E/S)
A partir do Gemini 2.0 Flash, a execução de código oferece suporte à entrada de arquivos e à saída de gráficos. Com esses novos recursos de entrada e saída, você pode fazer upload de arquivos CSV e de texto, fazer perguntas sobre os arquivos e gerar gráficos do Matplotlib como parte da resposta.
Preços de E/S
Ao usar a E/S de execução de código, você é cobrado por tokens de entrada e de saída:
Tokens de entrada:
- Comando do usuário
Tokens de saída:
- Código gerado pelo modelo
- Saída da execução do código no ambiente de código
- Resumo gerado pelo modelo
Detalhes de E/S
Ao trabalhar com E/S de execução de código, esteja ciente dos seguintes detalhes técnicos:
- O tempo de execução máximo do ambiente de código é de 30 segundos.
- Se o ambiente de código gerar um erro, o modelo poderá decidir regenerar a saída do código. Isso pode acontecer até cinco vezes.
- O tamanho máximo de entrada de arquivo é limitado pela janela de token do modelo. No AI Studio, usando o Gemini Flash 2.0, o tamanho máximo do arquivo de entrada é de 1 milhão de tokens (cerca de 2 MB para arquivos de texto dos tipos de entrada aceitos). Se você enviar um arquivo muito grande, o AI Studio não vai permitir que ele seja enviado.
Interação única | Bidirecional (API Multimodal Live) | |
---|---|---|
Modelos com suporte | Todos os modelos Gemini 2.0 | Somente modelos experimentais do Flash |
Tipos de entrada de arquivo aceitos | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts |
Bibliotecas de plotagem com suporte | Matplotlib | Matplotlib |
Uso de várias ferramentas | Não | Sim |
Faturamento
Não há cobrança extra para ativar a execução de código na API Gemini. A cobrança será feita com base na taxa atual de tokens de entrada e saída com base no modelo Gemini que você está usando.
Confira algumas outras informações sobre o faturamento para execução de código:
- Você só vai receber cobranças uma vez pelos tokens de entrada que transmitir ao modelo e pelos tokens de saída finais retornados pelo modelo.
- Os tokens que representam o código gerado são contados como tokens de saída. O código gerado pode incluir saídas de texto e multimodais, como imagens.
- Os resultados da execução do código também são contados como tokens de saída.
- A cobrança é feita com base na taxa atual de tokens de entrada e saída com base no modelo Gemini que você está usando.
- Se o Gemini usar a execução de código ao gerar a resposta, o comando original, o código gerado e o resultado do código executado serão rotulados como tokens intermediários e serão cobrados como tokens de entrada.
- O Gemini gera um resumo e retorna o código gerado, o resultado do código executado e o resumo final. Eles são cobrados como tokens de saída.
- A API Gemini inclui uma contagem de tokens intermediários na resposta da API para que você saiba por que está recebendo tokens de entrada adicionais além do comando inicial.
Limitações
- O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
- Em alguns casos, a ativação da execução de código pode levar a regressões em outras áreas da saída do modelo (por exemplo, na escrita de uma história).
- Há alguma variação na capacidade dos diferentes modelos de usar a execução do código com sucesso.