Compartilhar

27 DE OUTUBRO DE 2025

O Raindrop monitora a performance de agentes de IA em grande escala usando o Gemini 2.5 Flash

Alexis Gauba

Cofundador

Ben Hylak

Cofundador

Vishal Dharmadhikari

Engenheiro de soluções de produtos

Imagem principal da demonstração do Raindrop

Os agentes de IA apresentam desafios de monitoramento exclusivos em comparação com o software tradicional. As falhas em sistemas de IA geralmente são "silenciosas", ou seja, podem não produzir exceções ou erros padrão, o que dificulta a detecção de problemas para as equipes de engenharia. Os métodos tradicionais de depuração, como analisar registros ou confiar em avaliações de pré-produção, podem não capturar problemas de desempenho no mundo real.

O Raindrop oferece uma plataforma de monitoramento projetada especificamente para agentes de IA em produção. Ele ajuda as equipes de engenharia a identificar problemas complexos, como falhas de chamadas de ferramentas e frustração do usuário, processando fluxos enormes de interações do usuário. Para impulsionar o pipeline de monitoramento com eficiência, o Raindrop usa o Gemini 2.5 Flash para categorização, resumo e reclassificação da pesquisa.

Como ativar o monitoramento em tempo real em grande escala

A plataforma da Raindrop processa dezenas de milhões de eventos diariamente. Um dos principais desafios do Raindrop é permitir que as equipes de engenharia consultem e classifiquem problemas nesses vastos conjuntos de dados quase em tempo real. Quando um usuário define um novo problema para monitorar, o sistema do Raindrop precisa interpretar rapidamente a intenção do usuário e analisar fluxos de eventos para encontrar correspondências.

Esse processamento de alta capacidade de processamento exige modelos que ofereçam latência extremamente baixa e alta eficiência de custo. A Raindrop precisava de uma solução para impulsionar o pipeline principal de "monitoramento semântico" e novos recursos, como a Pesquisa avançada, uma ferramenta para pesquisar dados de IA de produção, sem incorrer em custos proibitivos ou tempos de resposta lentos que prejudicariam a experiência do usuário.

"Precisávamos de um modelo que pudesse processar rapidamente esses eventos iniciais a um custo razoável", disse Ben Hylak, cofundador e CTO da Raindrop. "A baixa latência e a inteligência do Gemini 2.5 Flash permitem que nosso produto Deep Research funcione. Caso contrário, ele seria inutilizável, muito lento e caro com outros modelos."

Implementação do Gemini 2.5 Flash para velocidade e saídas estruturadas

O Raindrop integrou o Gemini 2.5 Flash para gerenciar a categorização e a reescrita de consultas. A implementação foi simplificada usando o SDK de IA da Vercel, permitindo que o Raindrop integrasse os modelos rapidamente.

O Raindrop usa o Gemini 2.5 Flash para várias funções importantes:

  • Expansão e reescrita de consultas:no pipeline da Pesquisa Detalhada, o Gemini 2.5 Flash é usado para reescrever as consultas dos usuários e otimizar os resultados, melhorando a relevância da pesquisa em milhões de eventos.
  • Saídas estruturadas:o Raindrop usa chamadas de função e saídas estruturadas para garantir resultados mais precisos nas interações com o modelo. Essa confiabilidade é essencial para depurar e fornecer rastreamentos de raciocínio precisos aos usuários.


Antes de adotar o Gemini 2.5 Flash, a Raindrop avaliou outros modelos pequenos, mas achou a relação custo-benefício desfavorável. "Outros modelos eram muito caros, muito lentos, não eram inteligentes o suficiente ou não produziam resultados estruturados confiáveis". Hylak observou. "A proporção inteligência-custo só fazia sentido com o Gemini 2.5 Flash."

Redução de 90% nos custos e no tempo de pesquisa

Ao mudar para o modelo Gemini 2.5 Flash, a Raindrop alcançou ganhos significativos de performance e eficiência.

Os principais resultados incluem:

  • Redução no tempo de pesquisa de horas para menos de um minuto
  • Redução de custos em mais de 90%
  • Maior confiabilidade nas avaliações e no monitoramento da produção


O Raindrop usa o suporte da API Gemini para saídas estruturadas e chamadas de ferramentas no pipeline de pesquisa avançada. Isso permite que eles recebam resultados precisos e vejam rastreamentos de raciocínio para depuração, o que é fundamental para manter um sistema confiável. A integração inicial foi concluída em minutos usando o SDK de IA da Vercel.

Criando o futuro da observabilidade de agentes

O Raindrop continua desenvolvendo a plataforma de monitoramento nativa do agente com recursos como rastreamento completo e detecção automática de problemas de chamada de ferramenta. Eles acreditam que, à medida que os modelos de IA se tornam mais rápidos e confiáveis, os agentes poderão lidar com tarefas cada vez mais complexas.

"Os desenvolvedores devem aproveitar as saídas estruturadas confiáveis e o modelo de preços do Gemini 2.5 Flash para ativar casos de uso que antes eram considerados muito caros", aconselhou Hylak. "O Gemini 2.5 Flash pode mudar o curso do desenvolvimento de produtos, permitindo que você ofereça experiências inteligentes aos usuários que realmente funcionam com seu modelo de preços."

Para começar a criar seus próprios aplicativos, confira os recursos dos modelos do Gemini na nossa documentação da API.