اشتراک گذاری

۲۷ اکتبر ۲۰۲۵

Raindrop با استفاده از Gemini 2.5 Flash عملکرد عامل هوش مصنوعی را در مقیاس بزرگ رصد می‌کند.

الکسیس گائوبا

بنیانگذار مشترک

بن هایلاک

بنیانگذار مشترک

ویشال دارمادیکاری

مهندس راهکارهای محصول

قهرمان نمایشگاه قطرات باران

عوامل هوش مصنوعی در مقایسه با نرم‌افزارهای سنتی، چالش‌های نظارتی منحصر به فردی را ارائه می‌دهند. خرابی‌ها در سیستم‌های هوش مصنوعی اغلب «خاموش» هستند، به این معنی که ممکن است استثنائات یا خطاهای استاندارد ایجاد نکنند، که تشخیص مشکل را برای تیم‌های مهندسی دشوارتر می‌کند. روش‌های اشکال‌زدایی سنتی، مانند بررسی لاگ‌ها یا تکیه بر ارزیابی‌های پیش از تولید، ممکن است در ثبت مشکلات عملکرد در دنیای واقعی شکست بخورند.

رین‌دراپ یک پلتفرم نظارتی ارائه می‌دهد که به‌طور خاص برای عوامل هوش مصنوعی در تولید طراحی شده است. این پلتفرم به تیم‌های مهندسی کمک می‌کند تا با پردازش جریان‌های عظیم تعاملات کاربر، مسائل پیچیده‌ای مانند عدم موفقیت در فراخوانی ابزار و ناامیدی کاربر را شناسایی کنند. رین‌دراپ برای تقویت کارآمد خط لوله نظارتی خود، از Gemini 2.5 Flash برای دسته‌بندی، خلاصه‌سازی و رتبه‌بندی مجدد جستجو استفاده می‌کند.

فعال کردن نظارت بلادرنگ در مقیاس بزرگ

پلتفرم Raindrop روزانه ده‌ها میلیون رویداد را پردازش می‌کند. چالش اصلی Raindrop این است که تیم‌های مهندسی بتوانند مسائل را در این مجموعه داده‌های عظیم تقریباً به صورت بلادرنگ جستجو و طبقه‌بندی کنند. وقتی کاربر یک مسئله جدید را برای نظارت تعریف می‌کند، سیستم Raindrop باید به سرعت قصد کاربر را تفسیر کرده و جریان رویدادها را برای یافتن موارد منطبق تجزیه و تحلیل کند.

این پردازش با توان عملیاتی بالا نیازمند مدل‌هایی است که تأخیر بسیار کم و بهره‌وری هزینه بالایی را ارائه دهند. رین‌دراپ به راهکاری برای تقویت خط لوله اصلی «نظارت معنایی» خود و ویژگی‌های جدیدی مانند جستجوی عمیق - ابزاری برای تحقیق در داده‌های هوش مصنوعی تولیدی - نیاز داشت، بدون اینکه هزینه‌های گزاف یا زمان پاسخ‌دهی کندی را که به تجربه کاربر آسیب می‌رساند، متحمل شود.

بن هایلاک، یکی از بنیانگذاران و مدیر ارشد فناوری Raindrop، گفت: «ما به مدلی نیاز داشتیم که بتواند این رویدادهای اولیه را به سرعت و با هزینه‌ای معقول پردازش کند. تأخیر کم و هوشمندی Gemini 2.5 Flash، محصول Deep Search ما را که در غیر این صورت غیرقابل استفاده بود - بسیار کند و بسیار گران با سایر مدل‌ها - قادر می‌سازد.»

پیاده‌سازی Gemini 2.5 Flash برای خروجی‌های سریع و ساختاریافته

Raindrop برای مدیریت دسته‌بندی و بازنویسی کوئری‌ها، Gemini 2.5 Flash را یکپارچه کرد. پیاده‌سازی با استفاده از Vercel AI SDK ساده‌سازی شد و به Raindrop اجازه داد تا مدل‌ها را به سرعت ادغام کند.

Raindrop از Gemini 2.5 Flash برای چندین عملکرد کلیدی استفاده می‌کند:

  • گسترش و بازنویسی پرس‌وجو: در خط تولید جستجوی عمیق، از Gemini 2.5 Flash برای بازنویسی پرس‌وجوهای کاربر به منظور بهینه‌سازی نتایج و بهبود ارتباط جستجو در میلیون‌ها رویداد استفاده می‌شود.
  • خروجی‌های ساختاریافته: رین‌دراپ از فراخوانی ابزار و خروجی‌های ساختاریافته برای اطمینان از نتایج دقیق‌تر از تعاملات مدل استفاده می‌کند. این قابلیت اطمینان برای اشکال‌زدایی و ارائه ردیابی‌های استدلال دقیق به کاربران بسیار مهم است.


قبل از پذیرش Gemini 2.5 Flash، شرکت Raindrop مدل‌های کوچک دیگر را ارزیابی کرد، اما نسبت هزینه به عملکرد آنها را نامطلوب یافت. هایلاک خاطرنشان کرد: «مدل‌های دیگر یا خیلی گران، خیلی کند، به اندازه کافی هوشمند نبودند یا خروجی‌های ساختاریافته قابل اعتمادی تولید نمی‌کردند. نسبت هوش به هزینه فقط با Gemini 2.5 Flash منطقی بود.»

کاهش زمان جستجو و کاهش هزینه‌ها تا ۹۰٪

با تغییر به مدل Gemini 2.5 Flash، رین‌دراپ به افزایش قابل توجه عملکرد و بهره‌وری دست یافت.

نتایج کلیدی شامل موارد زیر است:

  • زمان جستجو از ساعت‌ها به اغلب کمتر از یک دقیقه کاهش یافته است
  • کاهش بیش از ۹۰ درصدی هزینه‌ها
  • افزایش قابلیت اطمینان در هر دو ارزیابی و نظارت بر تولید


رین‌دراپ از پشتیبانی رابط برنامه‌نویسی نرم‌افزار Gemini برای خروجی‌های ساختاریافته و فراخوانی‌های ابزار در خط لوله جستجوی عمیق خود استفاده می‌کند. این امر به آنها اجازه می‌دهد تا نتایج دقیقی دریافت کنند و ردپاهای استدلال را برای اشکال‌زدایی مشاهده کنند، که برای حفظ یک سیستم قابل اعتماد بسیار مهم است. ادغام اولیه با استفاده از Vercel AI SDK در عرض چند دقیقه انجام شد.

ساختن آینده‌ی مشاهده‌پذیری عامل

رین‌دراپ همچنان در حال توسعه پلتفرم نظارتی بومی خود با ویژگی‌هایی مانند ردیابی کامل و تشخیص خودکار مشکلات فراخوانی ابزار است. آنها معتقدند که با سریع‌تر و قابل اعتمادتر شدن مدل‌های هوش مصنوعی، عوامل قادر به انجام وظایف پیچیده‌تر خواهند بود.

هایلاک توصیه کرد: «توسعه‌دهندگان باید از خروجی‌های ساختاریافته و مدل قیمت‌گذاری قابل اعتماد Gemini 2.5 Flash بهره ببرند تا مواردی را که قبلاً فکر می‌کردند بسیار گران هستند، فعال کنند. Gemini 2.5 Flash احتمالاً می‌تواند با فراهم کردن امکان ارائه تجربیات هوشمند به کاربرانتان که واقعاً با مدل قیمت‌گذاری شما کار می‌کنند، مسیر توسعه محصول شما را تغییر دهد.»

برای شروع ساخت برنامه‌های خودتان، قابلیت‌های مدل‌های Gemini را در مستندات API ما بررسی کنید.

نصب شده

Instaly در حال ساخت یک پلتفرم جستجوی عامل‌محور است که برای کمک به شرکت‌ها در خودکارسازی و اجرای گردش‌های کاری پیچیده در فروش، خدمات و عملیات طراحی شده است.