27 अक्टूबर, 2025
Raindrop, Gemini 2.5 Flash का इस्तेमाल करके, एआई एजेंट की परफ़ॉर्मेंस को बड़े पैमाने पर मॉनिटर करता है
एआई एजेंट, पारंपरिक सॉफ़्टवेयर की तुलना में निगरानी से जुड़ी अलग तरह की चुनौतियां पेश करते हैं. एआई सिस्टम में गड़बड़ियां अक्सर "साइलेंट" होती हैं. इसका मतलब है कि वे स्टैंडर्ड अपवाद या गड़बड़ियां नहीं दिखाती हैं. इससे इंजीनियरिंग टीमों के लिए, गड़बड़ी का पता लगाना ज़्यादा मुश्किल हो जाता है. डीबग करने के पारंपरिक तरीके, जैसे कि लॉग की जांच करना या प्री-प्रोडक्शन के आकलन पर भरोसा करना, असल दुनिया में परफ़ॉर्मेंस से जुड़ी समस्याओं का पता लगाने में नाकाम हो सकते हैं.
Raindrop, एआई एजेंट की निगरानी करने के लिए एक प्लैटफ़ॉर्म उपलब्ध कराता है. इसे खास तौर पर प्रोडक्शन में एआई एजेंट के लिए डिज़ाइन किया गया है. यह इंजीनियरिंग टीमों को, टूल कॉल फ़ेल होने और उपयोगकर्ता के अनुभव से जुड़ी मुश्किल समस्याओं की पहचान करने में मदद करता है. इसके लिए, यह उपयोगकर्ता इंटरैक्शन की बड़ी स्ट्रीम को प्रोसेस करता है. मॉनिटरिंग पाइपलाइन को बेहतर तरीके से चलाने के लिए, Raindrop, Gemini 2.5 Flash का इस्तेमाल करता है. इससे कॉन्टेंट को कैटगरी में बाँटा जाता है, उसकी खास जानकारी दी जाती है, और खोज के नतीजों को फिर से रैंक किया जाता है.
बड़े पैमाने पर रीयल-टाइम मॉनिटरिंग की सुविधा चालू करना
Raindrop का प्लैटफ़ॉर्म, हर दिन लाखों इवेंट प्रोसेस करता है. Raindrop के लिए सबसे बड़ी चुनौती यह है कि वह इंजीनियरिंग टीमों को इन बड़े डेटासेट में, रीयल टाइम में क्वेरी करने और समस्याओं को कैटगरी में बांटने की सुविधा दे. जब कोई उपयोगकर्ता मॉनिटर करने के लिए नई समस्या तय करता है, तो Raindrop के सिस्टम को उपयोगकर्ता के मकसद को तुरंत समझना होता है. साथ ही, इवेंट स्ट्रीम का विश्लेषण करके मिलते-जुलते इवेंट ढूंढने होते हैं.
ज़्यादा थ्रूपुट वाली प्रोसेसिंग के लिए, ऐसे मॉडल की ज़रूरत होती है जो बहुत कम समय में प्रोसेस कर सकें और कम लागत में ज़्यादा फ़ायदे दे सकें. Raindrop को "सिमेंटिक मॉनिटरिंग" पाइपलाइन और डीप सर्च जैसी नई सुविधाओं को बेहतर बनाने के लिए, एक समाधान की ज़रूरत थी. डीप सर्च, प्रोडक्शन एआई डेटा पर रिसर्च करने का एक टूल है. इसके लिए, उसे ज़्यादा लागत या जवाब मिलने में ज़्यादा समय लगने जैसी समस्याओं से बचना था, ताकि उपयोगकर्ता अनुभव को बेहतर बनाया जा सके.
Raindrop के को-फ़ाउंडर और सीटीओ, बेन हिलाक ने कहा, "हमें एक ऐसे मॉडल की ज़रूरत थी जो इन शुरुआती इवेंट को कम लागत में तेज़ी से प्रोसेस कर सके." "Gemini 2.5 Flash की कम लेटेन्सी और बेहतर परफ़ॉर्मेंस की वजह से, हम Deep Search प्रॉडक्ट का इस्तेमाल कर पा रहे हैं. अगर हम किसी दूसरे मॉडल का इस्तेमाल करते, तो यह प्रॉडक्ट बहुत धीमा होता और इसकी लागत भी ज़्यादा होती."
तेज़ी से और व्यवस्थित तरीके से जवाब पाने के लिए, Gemini 2.5 Flash को लागू किया गया है
Raindrop ने कैटगरी मैनेज करने और क्वेरी को दोबारा लिखने के लिए, Gemini 2.5 Flash को इंटिग्रेट किया है. Vercel AI SDK का इस्तेमाल करके, लागू करने की प्रोसेस को आसान बनाया गया. इससे Raindrop को मॉडल को तेज़ी से इंटिग्रेट करने में मदद मिली.
Raindrop, कई मुख्य कामों के लिए Gemini 2.5 Flash का इस्तेमाल करता है:
- क्वेरी को बड़ा करना और फिर से लिखना: डीप सर्च पाइपलाइन में, Gemini 2.5 Flash का इस्तेमाल करके उपयोगकर्ता की क्वेरी को फिर से लिखा जाता है, ताकि नतीजों को ऑप्टिमाइज़ किया जा सके. इससे लाखों इवेंट में खोज के नतीजों को बेहतर बनाया जा सकता है.
- स्ट्रक्चर्ड आउटपुट: Raindrop, टूल कॉलिंग और स्ट्रक्चर्ड आउटपुट का इस्तेमाल करता है, ताकि मॉडल इंटरैक्शन से ज़्यादा सटीक नतीजे मिल सकें. यह भरोसेमंद होना, डीबग करने और उपयोगकर्ताओं को सटीक वजह बताने वाले ट्रेस देने के लिए ज़रूरी है.
Gemini 2.5 Flash को अपनाने से पहले, Raindrop ने अन्य छोटे मॉडल का आकलन किया. हालांकि, उसे परफ़ॉर्मेंस के हिसाब से लागत सही नहीं लगी. "अन्य मॉडल या तो बहुत महंगे थे, बहुत धीरे काम करते थे, उतने स्मार्ट नहीं थे या भरोसेमंद स्ट्रक्चर्ड आउटपुट नहीं देते थे.," ठीक है. "इंटेलिजेंस और लागत का अनुपात, सिर्फ़ Gemini 2.5 Flash के साथ सही था."
खोज के समय को कम करना और लागत को 90% तक कम करना
Gemini 2.5 Flash मॉडल पर स्विच करने से, Raindrop को परफ़ॉर्मेंस और दक्षता में काफ़ी फ़ायदा मिला.
मुख्य नतीजों में ये शामिल हैं:
- खोज के समय में कमी. अब खोज के नतीजे कुछ घंटों के बजाय, अक्सर एक मिनट से भी कम समय में मिल जाते हैं
- लागत में 90% से ज़्यादा की कटौती हुई
- ज़्यादा भरोसेमंद, जो आकलन और प्रोडक्शन मॉनिटरिंग, दोनों के लिए उपलब्ध है
Raindrop, डीप सर्च पाइपलाइन में स्ट्रक्चर्ड आउटपुट और टूल कॉल के लिए, Gemini API की सुविधा का इस्तेमाल करता है. इससे उन्हें सटीक नतीजे मिलते हैं. साथ ही, डीबग करने के लिए तर्क के ट्रेस देखने की सुविधा मिलती है. भरोसेमंद सिस्टम बनाए रखने के लिए यह सुविधा बहुत ज़रूरी है. Vercel AI SDK टूल का इस्तेमाल करके, शुरुआती इंटिग्रेशन को कुछ ही मिनटों में पूरा कर लिया गया.
एजेंट की परफ़ॉर्मेंस को मॉनिटर करने की सुविधा को बेहतर बनाना
Raindrop, एजेंट-नेटिव मॉनिटरिंग प्लैटफ़ॉर्म को बेहतर बनाने के लिए लगातार काम कर रहा है. इसमें पूरी ट्रेसिंग और टूल-कॉल से जुड़ी समस्याओं का अपने-आप पता लगाने जैसी सुविधाएं शामिल हैं. उनका मानना है कि एआई मॉडल के ज़्यादा तेज़ और भरोसेमंद होने से, एजेंट ज़्यादा मुश्किल कामों को आसानी से पूरा कर पाएंगे.
हैलक ने सलाह दी कि "डेवलपर को Gemini 2.5 Flash के भरोसेमंद स्ट्रक्चर्ड आउटपुट और कीमत वाले मॉडल का फ़ायदा उठाना चाहिए, ताकि वे उन मामलों में इसका इस्तेमाल कर सकें जिनके बारे में उन्हें पहले लगता था कि यह बहुत महंगा है." "Gemini 2.5 Flash, आपके प्रॉडक्ट डेवलपमेंट के तरीके को बदल सकता है. इससे आपको अपने उपयोगकर्ताओं को बेहतर अनुभव देने में मदद मिलती है. साथ ही, यह आपके प्राइसिंग मॉडल के साथ काम करता है."
अपने ऐप्लिकेशन बनाना शुरू करने के लिए, हमारे एपीआई दस्तावेज़ में Gemini मॉडल की क्षमताओं के बारे में जानें.