O recurso de execução de código da API Gemini permite que o modelo gere e execute código Python e aprenda de maneira iterativa com os resultados até chegar a uma saída final. Use esse recurso de execução de código para criar aplicativos que se beneficiam do raciocínio baseado em código e que produzem saída de texto. Por exemplo, é possível usar a execução de código em um aplicativo que resolve equações ou processa textos.
A execução de código está disponível no AI Studio e na API Gemini. No AI Studio, é possível ativar a execução do código no painel direito, em Ferramentas. A API Gemini oferece a execução de código como uma ferramenta, semelhante à chamada de função. Depois que você adiciona a execução do código como uma ferramenta, o modelo decide quando usá-la.
O ambiente de execução de código inclui as seguintes bibliotecas: altair
, chess
, cv2
, matplotlib
, mpmath
, numpy
, pandas
, pdfminer
, reportlab
, seaborn
, sklearn
, statsmodels
, striprtf
, sympy
e tabulate
. Não é possível instalar suas próprias bibliotecas.
Antes de começar
Antes de chamar a API Gemini, verifique se você tem o SDK de sua escolha instalado e uma chave da API Gemini configurada e pronta para uso.
Começar a usar a execução de código
Entrada/saída (E/S)
A partir do Gemini 2.0 Flash, a execução de código oferece suporte à entrada de arquivos e à saída de gráficos. Usando esses novos recursos de entrada e saída, é possível fazer upload de arquivos CSV e de texto, fazer perguntas sobre os arquivos e gerar gráficos Matplotlib como parte da resposta.
Preços de E/S
Ao usar E/S de execução de código, haverá cobrança por tokens de entrada e tokens de saída:
Tokens de entrada:
- Comando do usuário
Tokens de saída:
- Código gerado pelo modelo
- Saída da execução do código no ambiente de código
- Resumo gerado pelo modelo
Detalhes de E/S
Ao trabalhar com E/S de execução de código, esteja ciente dos seguintes detalhes técnicos:
- O ambiente de execução máximo do ambiente de código é de 30 segundos.
- Se o ambiente do código gerar um erro, o modelo poderá decidir gerar novamente a saída do código. Isso pode acontecer até cinco vezes.
- O tamanho máximo da entrada do arquivo é limitado pela janela do token do modelo. No AI Studio, usando o Gemini Flash 2.0, o tamanho máximo do arquivo de entrada é de 1 milhão de tokens (aproximadamente 2 MB para arquivos de texto dos tipos de entrada compatíveis). Se você fizer upload de um arquivo muito grande, o AI Studio não permitirá que você o envie.
Interação única | Bidirecional (API multimodal em tempo real) | |
---|---|---|
Modelos com suporte | Todos os modelos Gemini 2.0 | Somente modelos experimentais em Flash |
Tipos de entrada de arquivo compatíveis | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts |
Bibliotecas de plotagem compatíveis | Matplotlib | Matplotlib |
Uso de várias ferramentas | Não | Sim |
Faturamento
Não há custo extra para ativar a execução de código na API Gemini. Você vai receber cobranças de acordo com a taxa atual de tokens de entrada e saída com base no modelo do Gemini que estiver usando.
Confira algumas outras informações sobre o faturamento para execução de código:
- Você só é cobrado uma vez pelos tokens de entrada que são transferidos ao modelo e pelos tokens de saída finais retornados pelo modelo.
- Os tokens que representam o código gerado são contados como tokens de saída. O código gerado pode incluir texto e saída multimodal, como imagens.
- Os resultados da execução do código também são contados como tokens de saída.
O modelo de faturamento é mostrado no diagrama a seguir:
- A taxa atual de tokens de entrada e saída vai ser cobrada com base no modelo do Gemini que você está usando.
- Se o Gemini usar a execução de código ao gerar sua resposta, o comando original, o código gerado e o resultado do código executado serão rotulados como tokens intermediários e faturados como tokens de entrada.
- Em seguida, o Gemini gera um resumo e retorna o código gerado, o resultado do código executado e o resumo final. Eles são faturados como tokens de saída.
- A API Gemini inclui uma contagem intermediária de tokens na resposta da API. Assim, você sabe por que está recebendo mais tokens de entrada além do seu comando inicial.
Limitações
- O modelo só pode gerar e executar código. Ele não pode retornar outros artefatos, como arquivos de mídia.
- Em alguns casos, a ativação da execução de código pode levar a regressões em outras áreas da saída do modelo (por exemplo, na escrita de uma história).
- Há uma variação na capacidade de diferentes modelos usarem a execução do código com sucesso.