A API Gemini pode gerar saída de texto com base em vários tipos de entrada, incluindo texto, imagens, vídeo e áudio. Você pode usar a geração de texto para vários aplicativos, incluindo:
- Escrita criativa
- Descrição ou interpretação de recursos de mídia
- Preenchimento automático de texto
- Resumir texto em formato livre
- Como traduzir entre idiomas
- Seus próprios novos casos de uso
Este guia mostra como gerar texto usando as APIs
generateContent
e
streamGenerateContent
e o SDK do lado do servidor de sua escolha. O foco
está na saída de texto da entrada somente de texto e de texto e imagem. Para saber mais sobre
comandos multimodais com arquivos de vídeo e áudio, consulte
Como executar comandos com arquivos de mídia.
A seguir
Este guia mostra como usar
generateContent
e
streamGenerateContent
para gerar saídas de texto com base em entradas somente texto e texto e imagem. Para saber mais
sobre como gerar texto usando a API Gemini, confira os recursos abaixo:
- Comandos com arquivos de mídia: a API Gemini oferece suporte a comandos com dados de texto, imagem, áudio e vídeo, também conhecidos como comandos multimodais.
- Instruções do sistema: as instruções do sistema permitem orientar o comportamento do modelo com base nas suas necessidades e casos de uso específicos.
- Orientação de segurança: às vezes, os modelos de IA generativa produzem saídas inesperadas, como saídas imprecisas, tendenciosas ou ofensivas. O pós-processamento e a avaliação humana são essenciais para limitar o risco de danos causados por esses resultados.