27 अक्टूबर, 2025
Raindrop, Gemini 2.5 Flash का इस्तेमाल करके, बड़े पैमाने पर एआई एजेंट की परफ़ॉर्मेंस को मॉनिटर करता है
एआई एजेंट, पारंपरिक सॉफ़्टवेयर की तुलना में मॉनिटरिंग से जुड़ी अलग तरह की चुनौतियां पेश करते हैं. एआई सिस्टम में गड़बड़ियां अक्सर "साइलेंट" होती हैं. इसका मतलब है कि वे स्टैंडर्ड अपवाद या गड़बड़ियां नहीं दिखाती हैं. इससे इंजीनियरिंग टीमों के लिए, समस्या का पता लगाना ज़्यादा मुश्किल हो जाता है. डीबग करने के पारंपरिक तरीके, जैसे कि लॉग की जांच करना या प्री-प्रोडक्शन के आकलन पर भरोसा करना, परफ़ॉर्मेंस से जुड़ी असल दुनिया की समस्याओं का पता लगाने में नाकाम हो सकते हैं.
Raindrop, निगरानी करने वाला एक ऐसा प्लैटफ़ॉर्म उपलब्ध कराता है जिसे खास तौर पर प्रोडक्शन में एआई एजेंट के लिए डिज़ाइन किया गया है. यह इंजीनियरिंग टीमों को, उपयोगकर्ता इंटरैक्शन की बड़ी स्ट्रीम को प्रोसेस करके, टूल कॉल फ़ेल होने और उपयोगकर्ता की निराशा जैसी मुश्किल समस्याओं की पहचान करने में मदद करता है. मॉनिटरिंग पाइपलाइन को बेहतर तरीके से चलाने के लिए, Raindrop, Gemini 2.5 Flash का इस्तेमाल करता है. इससे कॉन्टेंट को कैटगरी में बाँटा जा सकता है, उसकी खास जानकारी दी जा सकती है, और खोज के नतीजों को फिर से रैंक किया जा सकता है.
बड़े पैमाने पर रीयल-टाइम मॉनिटरिंग की सुविधा चालू करना
Raindrop का प्लैटफ़ॉर्म, हर दिन लाखों इवेंट प्रोसेस करता है. Raindrop के लिए सबसे बड़ी चुनौती यह है कि वह इंजीनियरिंग टीमों को इन बड़े डेटासेट में, रीयल टाइम में क्वेरी करने और समस्याओं को कैटगरी में बांटने की सुविधा दे. जब कोई उपयोगकर्ता मॉनिटर करने के लिए नई समस्या तय करता है, तो Raindrop के सिस्टम को उपयोगकर्ता के मकसद को तुरंत समझना होता है. साथ ही, इवेंट स्ट्रीम का विश्लेषण करके मिलते-जुलते इवेंट ढूंढने होते हैं.
ज़्यादा थ्रूपुट वाली प्रोसेसिंग के लिए, ऐसे मॉडल की ज़रूरत होती है जो बहुत कम समय में प्रोसेस कर सकें और कम लागत में ज़्यादा फ़ायदे दे सकें. Raindrop को "सिमेंटिक मॉनिटरिंग" पाइपलाइन और डीप सर्च जैसी नई सुविधाओं को बेहतर बनाने के लिए एक समाधान की ज़रूरत थी. डीप सर्च, प्रोडक्शन एआई डेटा पर रिसर्च करने का एक टूल है. इसके लिए, उसे ऐसी लागत नहीं चुकानी थी जो उपयोगकर्ताओं के अनुभव को खराब कर दे. साथ ही, उसे जवाब मिलने में ज़्यादा समय नहीं लगना चाहिए था.
Raindrop के को-फ़ाउंडर और सीटीओ, बेन हिलाक ने कहा, "हमें एक ऐसे मॉडल की ज़रूरत थी जो इन शुरुआती इवेंट को कम लागत में तेज़ी से प्रोसेस कर सके." "Gemini 2.5 Flash की कम लेटेन्सी और बेहतर परफ़ॉर्मेंस की वजह से, हम Deep Search प्रॉडक्ट का इस्तेमाल कर पा रहे हैं. अगर हम किसी दूसरे मॉडल का इस्तेमाल करते, तो यह प्रॉडक्ट बहुत धीमा होता और इसकी लागत भी ज़्यादा होती."
तेज़ी से और व्यवस्थित तरीके से जवाब पाने के लिए, Gemini 2.5 Flash को लागू किया गया है
Raindrop ने कैटगरी मैनेज करने और क्वेरी को दोबारा लिखने के लिए, Gemini 2.5 Flash को इंटिग्रेट किया है. Vercel AI SDK का इस्तेमाल करके, लागू करने की प्रोसेस को आसान बनाया गया. इससे Raindrop को मॉडल को तेज़ी से इंटिग्रेट करने में मदद मिली.
Raindrop, कई मुख्य कामों के लिए Gemini 2.5 Flash का इस्तेमाल करता है:
- क्वेरी को बड़ा करना और फिर से लिखना: डीप सर्च पाइपलाइन में, Gemini 2.5 Flash का इस्तेमाल करके उपयोगकर्ता की क्वेरी को फिर से लिखा जाता है, ताकि नतीजों को ऑप्टिमाइज़ किया जा सके. इससे लाखों इवेंट में खोज के नतीजों को बेहतर बनाया जा सकता है.
- स्ट्रक्चर्ड आउटपुट: Raindrop, टूल कॉलिंग और स्ट्रक्चर्ड आउटपुट का इस्तेमाल करता है, ताकि मॉडल इंटरैक्शन से ज़्यादा सटीक नतीजे मिल सकें. यह भरोसेमंद होना, डीबग करने और उपयोगकर्ताओं को सटीक वजह बताने वाले ट्रेस देने के लिए ज़रूरी है.
Gemini 2.5 Flash को अपनाने से पहले, Raindrop ने अन्य छोटे मॉडल का आकलन किया. हालांकि, उसे परफ़ॉर्मेंस के हिसाब से लागत सही नहीं लगी. "अन्य मॉडल या तो बहुत महंगे थे, बहुत धीरे काम करते थे, उतने स्मार्ट नहीं थे या भरोसेमंद स्ट्रक्चर्ड आउटपुट नहीं देते थे." ठीक है. "इंटेलिजेंस और लागत का अनुपात, सिर्फ़ Gemini 2.5 Flash के साथ सही था."
खोज के समय को कम करना और लागत को 90% तक कम करना
Gemini 2.5 Flash मॉडल का इस्तेमाल करने से, Raindrop की परफ़ॉर्मेंस और दक्षता में काफ़ी सुधार हुआ.
मुख्य नतीजों में ये शामिल हैं:
- खोज के समय में कमी. अब खोज के नतीजे कुछ घंटों के बजाय, अक्सर एक मिनट से भी कम समय में मिल जाते हैं
- लागत में 90% से ज़्यादा की कटौती
- दोनों तरह के आकलन और प्रोडक्शन मॉनिटरिंग में बेहतर भरोसेमंद नतीजे
Raindrop, डीप सर्च पाइपलाइन में स्ट्रक्चर्ड आउटपुट और टूल कॉल के लिए, Gemini API की सहायता का इस्तेमाल करता है. इससे उन्हें सटीक नतीजे मिलते हैं. साथ ही, डीबग करने के लिए तर्क के ट्रेस देखने की सुविधा मिलती है. यह एक भरोसेमंद सिस्टम बनाए रखने के लिए ज़रूरी है. Vercel AI SDK टूल का इस्तेमाल करके, शुरुआती इंटिग्रेशन को कुछ ही मिनटों में पूरा कर लिया गया.
एजेंट की परफ़ॉर्मेंस को मॉनिटर करने की सुविधा को बेहतर बनाना
Raindrop, एजेंट-नेटिव मॉनिटरिंग प्लैटफ़ॉर्म को बेहतर बनाने का काम जारी रखेगा. इसमें पूरी ट्रेसिंग और टूल-कॉल से जुड़ी समस्याओं का अपने-आप पता लगाने जैसी सुविधाएं शामिल हैं. उनका मानना है कि एआई मॉडल के ज़्यादा तेज़ और भरोसेमंद होने से, एजेंट ज़्यादा मुश्किल कामों को आसानी से कर पाएंगे.
हैलक ने सलाह दी कि "डेवलपर को Gemini 2.5 Flash के भरोसेमंद स्ट्रक्चर्ड आउटपुट और कीमत वाले मॉडल का फ़ायदा उठाना चाहिए, ताकि वे उन मामलों में इसका इस्तेमाल कर सकें जिनके बारे में उन्हें पहले लगता था कि यह बहुत महंगा है." "Gemini 2.5 Flash, आपके प्रॉडक्ट डेवलपमेंट के तरीके को बदल सकता है. इससे आपको अपने उपयोगकर्ताओं को बेहतर अनुभव देने में मदद मिलती है. साथ ही, यह आपके प्राइसिंग मॉडल के साथ काम करता है."
अपने ऐप्लिकेशन बनाना शुरू करने के लिए, हमारे एपीआई दस्तावेज़ में Gemini मॉडल की क्षमताओं के बारे में जानें.