۲۷ اکتبر ۲۰۲۵
Raindrop با استفاده از Gemini 2.5 Flash عملکرد عامل هوش مصنوعی را در مقیاس بزرگ رصد میکند.

عوامل هوش مصنوعی در مقایسه با نرمافزارهای سنتی، چالشهای نظارتی منحصر به فردی را ارائه میدهند. خرابیها در سیستمهای هوش مصنوعی اغلب «خاموش» هستند، به این معنی که ممکن است استثنائات یا خطاهای استاندارد ایجاد نکنند، که تشخیص مشکل را برای تیمهای مهندسی دشوارتر میکند. روشهای اشکالزدایی سنتی، مانند بررسی لاگها یا تکیه بر ارزیابیهای پیش از تولید، ممکن است در ثبت مشکلات عملکرد در دنیای واقعی شکست بخورند.
ریندراپ یک پلتفرم نظارتی ارائه میدهد که بهطور خاص برای عوامل هوش مصنوعی در تولید طراحی شده است. این پلتفرم به تیمهای مهندسی کمک میکند تا با پردازش جریانهای عظیم تعاملات کاربر، مسائل پیچیدهای مانند عدم موفقیت در فراخوانی ابزار و ناامیدی کاربر را شناسایی کنند. ریندراپ برای تقویت کارآمد خط لوله نظارتی خود، از Gemini 2.5 Flash برای دستهبندی، خلاصهسازی و رتبهبندی مجدد جستجو استفاده میکند.
فعال کردن نظارت بلادرنگ در مقیاس بزرگ
پلتفرم Raindrop روزانه دهها میلیون رویداد را پردازش میکند. چالش اصلی Raindrop این است که تیمهای مهندسی بتوانند مسائل را در این مجموعه دادههای عظیم تقریباً به صورت بلادرنگ جستجو و طبقهبندی کنند. وقتی کاربر یک مسئله جدید را برای نظارت تعریف میکند، سیستم Raindrop باید به سرعت قصد کاربر را تفسیر کرده و جریان رویدادها را برای یافتن موارد منطبق تجزیه و تحلیل کند.
این پردازش با توان عملیاتی بالا نیازمند مدلهایی است که تأخیر بسیار کم و بهرهوری هزینه بالایی را ارائه دهند. ریندراپ به راهکاری برای تقویت خط لوله اصلی «نظارت معنایی» خود و ویژگیهای جدیدی مانند جستجوی عمیق - ابزاری برای تحقیق در دادههای هوش مصنوعی تولیدی - نیاز داشت، بدون اینکه هزینههای گزاف یا زمان پاسخدهی کندی را که به تجربه کاربر آسیب میرساند، متحمل شود.
بن هایلاک، یکی از بنیانگذاران و مدیر ارشد فناوری Raindrop، گفت: «ما به مدلی نیاز داشتیم که بتواند این رویدادهای اولیه را به سرعت و با هزینهای معقول پردازش کند. تأخیر کم و هوشمندی Gemini 2.5 Flash، محصول Deep Search ما را که در غیر این صورت غیرقابل استفاده بود - بسیار کند و بسیار گران با سایر مدلها - قادر میسازد.»
پیادهسازی Gemini 2.5 Flash برای خروجیهای سریع و ساختاریافته
Raindrop برای مدیریت دستهبندی و بازنویسی کوئریها، Gemini 2.5 Flash را یکپارچه کرد. پیادهسازی با استفاده از Vercel AI SDK سادهسازی شد و به Raindrop اجازه داد تا مدلها را به سرعت ادغام کند.
Raindrop از Gemini 2.5 Flash برای چندین عملکرد کلیدی استفاده میکند:
- گسترش و بازنویسی پرسوجو: در خط تولید جستجوی عمیق، از Gemini 2.5 Flash برای بازنویسی پرسوجوهای کاربر به منظور بهینهسازی نتایج و بهبود ارتباط جستجو در میلیونها رویداد استفاده میشود.
- خروجیهای ساختاریافته: ریندراپ از فراخوانی ابزار و خروجیهای ساختاریافته برای اطمینان از نتایج دقیقتر از تعاملات مدل استفاده میکند. این قابلیت اطمینان برای اشکالزدایی و ارائه ردیابیهای استدلال دقیق به کاربران بسیار مهم است.
قبل از پذیرش Gemini 2.5 Flash، شرکت Raindrop مدلهای کوچک دیگر را ارزیابی کرد، اما نسبت هزینه به عملکرد آنها را نامطلوب یافت. هایلاک خاطرنشان کرد: «مدلهای دیگر یا خیلی گران، خیلی کند، به اندازه کافی هوشمند نبودند یا خروجیهای ساختاریافته قابل اعتمادی تولید نمیکردند. نسبت هوش به هزینه فقط با Gemini 2.5 Flash منطقی بود.»
کاهش زمان جستجو و کاهش هزینهها تا ۹۰٪
با تغییر به مدل Gemini 2.5 Flash، ریندراپ به افزایش قابل توجه عملکرد و بهرهوری دست یافت.
نتایج کلیدی شامل موارد زیر است:
- زمان جستجو از ساعتها به اغلب کمتر از یک دقیقه کاهش یافته است
- کاهش بیش از ۹۰ درصدی هزینهها
- افزایش قابلیت اطمینان در هر دو ارزیابی و نظارت بر تولید
ریندراپ از پشتیبانی رابط برنامهنویسی نرمافزار Gemini برای خروجیهای ساختاریافته و فراخوانیهای ابزار در خط لوله جستجوی عمیق خود استفاده میکند. این امر به آنها اجازه میدهد تا نتایج دقیقی دریافت کنند و ردپاهای استدلال را برای اشکالزدایی مشاهده کنند، که برای حفظ یک سیستم قابل اعتماد بسیار مهم است. ادغام اولیه با استفاده از Vercel AI SDK در عرض چند دقیقه انجام شد.
ساختن آیندهی مشاهدهپذیری عامل
ریندراپ همچنان در حال توسعه پلتفرم نظارتی بومی خود با ویژگیهایی مانند ردیابی کامل و تشخیص خودکار مشکلات فراخوانی ابزار است. آنها معتقدند که با سریعتر و قابل اعتمادتر شدن مدلهای هوش مصنوعی، عوامل قادر به انجام وظایف پیچیدهتر خواهند بود.
هایلاک توصیه کرد: «توسعهدهندگان باید از خروجیهای ساختاریافته و مدل قیمتگذاری قابل اعتماد Gemini 2.5 Flash بهره ببرند تا مواردی را که قبلاً فکر میکردند بسیار گران هستند، فعال کنند. Gemini 2.5 Flash احتمالاً میتواند با فراهم کردن امکان ارائه تجربیات هوشمند به کاربرانتان که واقعاً با مدل قیمتگذاری شما کار میکنند، مسیر توسعه محصول شما را تغییر دهد.»
برای شروع ساخت برنامههای خودتان، قابلیتهای مدلهای Gemini را در مستندات API ما بررسی کنید.
نصب شده
Instaly در حال ساخت یک پلتفرم جستجوی عاملمحور است که برای کمک به شرکتها در خودکارسازی و اجرای گردشهای کاری پیچیده در فروش، خدمات و عملیات طراحی شده است.