O Gemini gera texto não estruturado por padrão, mas alguns aplicativos exigem texto estruturado. Para esses casos de uso, é possível restringir o Gemini para responder com JSON, um formato de dados estruturados adequado para processamento automatizado.
Por exemplo, estes casos de uso exigem uma saída estruturada do modelo:
- Construa um banco de dados de empresas extraindo informações de artigos de jornais.
- Extraia informações padronizadas de currículos.
- Extraia ingredientes de receitas e mostre um link para um site de supermercado com cada ingrediente.
No comando, você pode pedir que o Gemini produza uma saída formatada em JSON, mas observe
que o Google não pode garantir que ele vai produzir JSON e nada além de JSON.
No entanto, se você usa o Gemini 1.5 Pro, é possível transmitir um esquema JSON específico em um
campo response_schema
para que o Gemini sempre responda com uma estrutura
esperada.
Este guia mostra como gerar JSON usando o método
generateContent
com o SDK
de sua escolha. Ele se concentra em entrada somente de texto, embora o Gemini também possa produzir respostas JSON para consultas multimodais. Para saber mais sobre comandos multimodais
com arquivos de vídeo e áudio, consulte
Como executar comandos com arquivos de mídia.