Делиться

27 октября 2025 г.

Raindrop отслеживает производительность агентов ИИ в масштабе предприятия с помощью Gemini 2.5 Flash.

Алексис Гауба

Соучредитель

Бен Хайлак

Соучредитель

Вишал Дхармадхикари

Инженер по разработке продуктовых решений

Герой выставки «Капля дождя»

По сравнению с традиционным программным обеспечением, агенты ИИ представляют собой уникальные проблемы мониторинга. Сбои в системах ИИ часто происходят «бесшумно», то есть они могут не вызывать стандартных исключений или ошибок, что затрудняет обнаружение проблем для инженерных групп. Традиционные методы отладки, такие как анализ журналов или использование результатов предпроизводственных оценок, могут оказаться неэффективными для выявления реальных проблем с производительностью.

Raindrop предоставляет платформу мониторинга, специально разработанную для ИИ-агентов в производственной среде. Она помогает командам разработчиков выявлять сложные проблемы, такие как сбои при вызове инструментов и недовольство пользователей, обрабатывая огромные потоки пользовательских взаимодействий. Для эффективной работы конвейера мониторинга Raindrop использует Gemini 2.5 Flash для категоризации, суммирования и переранжирования результатов поиска.

Обеспечение мониторинга в режиме реального времени в масштабах предприятия

Платформа Raindrop обрабатывает десятки миллионов событий ежедневно. Основная задача для Raindrop — обеспечить возможность инженерным командам запрашивать и классифицировать проблемы в этих огромных массивах данных практически в режиме реального времени. Когда пользователь определяет новую проблему для мониторинга, система Raindrop должна быстро интерпретировать намерение пользователя и анализировать потоки событий для поиска совпадений.

Такая высокопроизводительная обработка требует моделей, обеспечивающих чрезвычайно низкую задержку и высокую экономическую эффективность. Raindrop нуждалась в решении для обеспечения работы своего основного конвейера «семантического мониторинга» и новых функций, таких как Deep Search — инструмент для исследования данных ИИ в производственной среде — без чрезмерных затрат или медленного времени отклика, которое ухудшило бы пользовательский опыт.

«Нам нужна была модель, которая могла бы быстро обрабатывать эти первоначальные события по разумной цене», — сказал Бен Хайлак, соучредитель и технический директор Raindrop. «Низкая задержка и интеллектуальные возможности Gemini 2.5 Flash позволяют реализовать наш продукт Deep Search, который в противном случае был бы непригоден для использования — слишком медленный и слишком дорогой с другими моделями».

Внедрение Gemini 2.5 Flash для повышения скорости и получения структурированных результатов.

Raindrop интегрировала Gemini 2.5 Flash для управления категоризацией и переписыванием запросов. Внедрение было оптимизировано с помощью Vercel AI SDK, что позволило Raindrop быстро интегрировать модели.

Raindrop использует вспышку Gemini 2.5 Flash для выполнения нескольких ключевых функций:

  • Расширение и переписывание запросов: В конвейере глубокого поиска Gemini 2.5 Flash используется для переписывания пользовательских запросов с целью оптимизации результатов и повышения релевантности поиска по миллионам событий.
  • Структурированные выходные данные: Raindrop использует вызов инструментов и структурированные выходные данные для обеспечения более точных результатов взаимодействия моделей. Эта надежность имеет решающее значение для отладки и предоставления пользователям точных трассировок логического вывода.


Прежде чем выбрать Gemini 2.5 Flash, компания Raindrop оценила другие небольшие модели, но обнаружила, что соотношение цены и производительности неблагоприятно. «Другие модели были либо слишком дорогими, либо слишком медленными, либо недостаточно интеллектуальными, либо не обеспечивали надежные структурированные результаты», — отметил Хайлак. «Соотношение интеллекта и стоимости имело смысл только с Gemini 2.5 Flash».

Сокращение времени поиска и снижение затрат на 90%.

Перейдя на модель Gemini 2.5 Flash, компания Raindrop добилась значительного повышения производительности и эффективности.

Ключевые результаты включают:

  • Время поиска сократилось с нескольких часов до зачастую менее минуты.
  • Сокращение расходов более чем на 90%.
  • Повышена надежность как в процессе оценки, так и в мониторинге производства.


Raindrop использует поддержку структурированных выходных данных и вызовов инструментов API Gemini в своем конвейере глубокого поиска. Это позволяет получать точные результаты и просматривать трассировки логического вывода для отладки, что крайне важно для поддержания надежной системы. Первоначальная интеграция была завершена за считанные минуты с использованием SDK Vercel AI.

Создание будущего наблюдаемости агентов

Компания Raindrop продолжает развивать свою платформу мониторинга, ориентированную на агентов, с такими функциями, как полная трассировка и автоматическое обнаружение проблем, связанных с вызовами инструментов. Они считают, что по мере того, как модели ИИ становятся быстрее и надежнее, агенты смогут справляться со все более сложными задачами.

«Разработчикам следует воспользоваться преимуществами надежных структурированных выходных данных и ценовой модели Gemini 2.5 Flash, чтобы реализовать сценарии использования, которые ранее могли казаться им непомерно дорогими», — посоветовал Хайлак. «Gemini 2.5 Flash, вероятно, сможет изменить ход разработки вашего продукта, позволив вам предоставлять пользователям интеллектуальные возможности, которые действительно соответствуют вашей ценовой модели».

Чтобы начать разработку собственных приложений, изучите возможности моделей Gemini в нашей документации по API .

Pacal AI

В своей системе анализа финансовых документов Pascal AI использует Gemini 2.5 Pro, что позволяет добиться вдвое большей точности при обработке сложных данных.