20 अक्टूबर, 2025
Firecrawl, एआई ऐप्लिकेशन के लिए वेब डेटा को व्यवस्थित करने के लिए Gemini 2.5 Pro का इस्तेमाल करता है
एआई ऐप्लिकेशन को वेब से लाइव और असल दुनिया की जानकारी ऐक्सेस करने की ज़रूरत होती है. जैसे, जानकारी पाने के लिए जनरेटिव एआई का इस्तेमाल करने वाले सिस्टम (आरएजी) और ऑटोनॉमस एजेंट. हालांकि, वेब कॉन्टेंट अक्सर अनस्ट्रक्चर्ड, डाइनैमिक, और अलग-अलग तरह का होता है. इसलिए, डेवलपर के लिए भरोसेमंद डेटा निकालना एक बड़ी चुनौती होती है.
Firecrawl, एआई पर आधारित एक वेब डेटा प्लैटफ़ॉर्म है. यह ऐसे एपीआई उपलब्ध कराता है जिनकी मदद से डेवलपर और एआई सिस्टम, वेब डेटा को बड़े पैमाने पर प्रोग्राम के हिसाब से ढूंढ सकते हैं, फ़ेच कर सकते हैं, पार्स कर सकते हैं, और स्ट्रक्चर कर सकते हैं. ये टूल, वेब स्क्रैपिंग की मुश्किल प्रोसेस को आसान बना देते हैं. साथ ही, वेब पर मौजूद अनस्ट्रक्चर्ड कॉन्टेंट को साफ़ और इस्तेमाल किए जा सकने वाले डेटा में बदल देते हैं.
इसके लिए, Firecrawl अपने मुख्य एक्सट्रैक्शन इंजन को बेहतर बनाने के लिए, Gemini 2.5 Pro का इस्तेमाल करता है. Gemini के मॉडल, भाषा को समझने और गहराई से विश्लेषण करने की बेहतर क्षमताएं उपलब्ध कराते हैं. इनसे अलग-अलग तरह के वेब कॉन्टेंट को सटीक तरीके से पार्स करने में मदद मिलती है.
वेब पर मौजूद अव्यवस्थित डेटा को इस्तेमाल किए जा सकने वाले डेटा में बदलना
Firecrawl का मकसद, पूरे वेब को एआई सिस्टम के लिए ऐक्सेस किया जा सकने वाला बनाना है. नियमों पर आधारित वेब स्क्रैपिंग के पारंपरिक तरीके अक्सर कमज़ोर होते हैं. साथ ही, वेबसाइट के स्ट्रक्चर में अक्सर बदलाव होने की वजह से, इन्हें लगातार अपडेट करते रहना पड़ता है. Firecrawl को एक ऐसे समाधान की ज़रूरत थी जो कॉन्टेक्स्ट को समझ सके और भरोसेमंद तरीके से डेटा निकाल सके. भले ही, डेटा अलग-अलग सोर्स से लिया गया हो.
Firecrawl ने Gemini 2.5 Pro का इस्तेमाल करके दो मुख्य प्रॉडक्ट बनाए हैं:
- SmartScrape: यह डेटा निकालने वाला टूल है. यह Gemini 2.5 Pro की भाषा समझने और तर्क करने की क्षमताओं का इस्तेमाल करके, रॉ एचटीएमएल को स्ट्रक्चर्ड आउटपुट में बदलता है. जैसे, JSON या कुंजी-वैल्यू पेयर. यह कॉन्टेक्स्ट के हिसाब से जानकारी निकालता है. साथ ही, यह पेज पर डेटा की जगह के बजाय, उपयोगकर्ता के तय किए गए लक्ष्यों के हिसाब से डेटा का मतलब समझता है.
- FIRE-1: यह एक्सपेरिमेंट के तौर पर उपलब्ध एजेंट फ़्रेमवर्क है. यह Gemini 2.5 Pro का इस्तेमाल करके, उपयोगकर्ता के इरादे को समझता है, वेब कॉन्टेंट को नेविगेट करता है, और लाइव वेब डेटा के आधार पर आउटपुट जनरेट करता है.
Gemini 2.5 Pro को अपनाने से पहले, Firecrawl ने कई बेहतरीन मॉडल का आकलन किया. उन्होंने पाया कि अन्य मॉडल, प्रोडक्शन स्केल पर असली दुनिया के वेब कॉन्टेंट की जटिलता और बदलावों को मैनेज करने में मुश्किलों का सामना करते हैं.
Firecrawl के सह-संस्थापक, एरिक सिएर्ला ने कहा, "Gemini 2.5 Pro की वजह से, पूरे प्रोजेक्ट को पूरा करना मुमकिन हो पाया." "Gemini 2.5 Pro का इस्तेमाल करने से पहले, हमने जिन मॉडल को टेस्ट किया था वे वेब पर मौजूद कॉन्टेंट से जानकारी निकालने और उस पर तर्क करने के लिए, ज़रूरी जटिलता को भरोसेमंद तरीके से हैंडल नहीं कर सके. Gemini 2.5 Pro की तर्क करने की क्षमता, सटीक जवाब देने की क्षमता, और स्थिरता की वजह से, हम कॉन्फ़िडेंस के साथ आगे बढ़ पाए."
टूल कॉलिंग की सुविधा के साथ Gemini 2.5 Pro को लागू करना
Firecrawl ने Gemini 2.5 Pro को अपने प्रॉडक्ट में करीब एक हफ़्ते में इंटिग्रेट कर लिया. ये अपने एजेंट आर्किटेक्चर में, मॉडल की तर्क करने और टूल कॉल करने की क्षमताओं का इस्तेमाल करते हैं.
FIRE-1 एजेंट फ़्रेमवर्क में, मॉडल एक एजेंट लूप के अंदर काम करता है. यह लूप, Gemini 2.5 Pro की तर्क क्षमता को कंट्रोल फ़्लो के साथ जोड़ता है. यह प्रोसेस इस तरह काम करती है:
- इनपुट: एजेंट को वेबपेज का दस्तावेज़ ऑब्जेक्ट मॉडल (डीओएम) और उपयोगकर्ता का तय किया गया लक्ष्य मिलता है. उदाहरण के लिए, "मुझे इस वेबसाइट के सभी पेज दिखाओ").
- वजह: Gemini 2.5 Pro, इनपुट का विश्लेषण करता है और ज़रूरी कार्रवाइयों का पता लगाता है.
- कार्रवाई करना: मॉडल, टूल कॉलिंग (फ़ंक्शन कॉल) के ज़रिए इन कार्रवाइयों को पूरा करता है. नेविगेशन से जुड़े टास्क के लिए, एजेंट ज़रूरी डेटा पाने के लिए, क्लिक(next_page) जैसे फ़ंक्शन अपने-आप चालू कर सकता है.
इस तरीके से, Firecrawl को वेब नेविगेशन और डेटा निकालने जैसे मुश्किल टास्क को हैंडल करने में मदद मिलती है. इन टास्क के लिए, फ़्लेक्सिबिलिटी और अनुमान लगाने की क्षमता, दोनों ज़रूरी होती हैं.
डेटा को 98% सटीकता के साथ एक्सट्रैक्ट करना
इंटरनल बेंचमार्क में, Gemini 2.5 Pro ने अन्य मॉडल की तुलना में, जानकारी निकालने और वेब पार्सिंग को सटीक तरीके से करने में बेहतर परफ़ॉर्म किया. Firecrawl ने इन मॉडल का आकलन किया था.
Firecrawl के इंटरनल आकलन में, Gemini 2.5 Pro ने 98% सटीकता हासिल की है. टेस्ट किए गए दूसरे सबसे अच्छे मॉडल की सटीकता करीब 80% थी. परफ़ॉर्मेंस में हुई इस बढ़ोतरी से, एक्सट्रैक्शन के बेहतर नतीजे मिले. साथ ही, प्रोडक्शन वर्कलोड में एजेंट के व्यवहार में ज़्यादा भरोसेमंद तरीके से काम करने की क्षमता बढ़ी.
सिएर्ला ने कहा, "हमने इंटरनल टेस्टिंग में पाया कि Gemini 2.5 Pro, हमारे इस्तेमाल के उदाहरण के लिए हर मुख्य डाइमेंशन में अन्य मॉडल से बेहतर परफ़ॉर्म करता है. जैसे, जानकारी निकालने की सटीक क्षमता, जटिल तर्क, लेटेन्सी, और कुल थ्रूपुट."
वेब इंटरैक्शन को बेहतर बनाना
Gemini मॉडल अब Firecrawl के एआई इन्फ़्रास्ट्रक्चर का एक बुनियादी हिस्सा हैं. इससे, वे एआई प्रॉडक्ट के लिए भरोसेमंद वेब डेटा पाइपलाइन उपलब्ध करा पाते हैं.
फ़िलहाल, Firecrawl ऐसे इस्तेमाल के उदाहरणों के लिए Gemini 2.5 Flash का आकलन कर रहा है जिनमें बहुत कम समय में जवाब देने की ज़रूरत होती है. साथ ही, रीयल-टाइम में एजेंट के साथ इंटरैक्शन करना ज़रूरी होता है. Gemini मॉडल फ़ैमिली के बेहतर होने के साथ-साथ, Firecrawl नई क्षमताओं को इंटिग्रेट करने का प्लान बना रहा है. इससे, एआई एजेंट के वेब पर मौजूद असल डेटा के साथ इंटरैक्ट करने के तरीके को और बेहतर बनाया जा सकेगा.
अपने ऐप्लिकेशन बनाना शुरू करने के लिए, हमारे एपीआई के दस्तावेज़ में जाकर, Gemini मॉडल की क्षमताओं के बारे में जानें.