शेयर करें

20 अक्टूबर, 2025

Firecrawl, एआई ऐप्लिकेशन के लिए वेब डेटा को व्यवस्थित करने के लिए Gemini 2.5 Pro का इस्तेमाल करता है

एरिक सियर्ला

सह-संस्थापक

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

Firecrawl के शोकेस पेज पर मौजूद हीरो इमेज

एआई ऐप्लिकेशन को वेब से लाइव और असल दुनिया की जानकारी का ऐक्सेस चाहिए. जैसे, रीट्रिवल-ऑगमेंटेड जनरेशन (आरएजी) सिस्टम और ऑटोनॉमस एजेंट. हालांकि, वेब कॉन्टेंट अक्सर अनस्ट्रक्चर्ड, डाइनैमिक, और अलग-अलग तरह का होता है. इसलिए, डेवलपर के लिए भरोसेमंद डेटा निकालना एक बड़ी चुनौती होती है.

Firecrawl, एआई पर आधारित एक वेब डेटा प्लैटफ़ॉर्म है. यह ऐसे एपीआई उपलब्ध कराता है जिनकी मदद से डेवलपर और एआई सिस्टम, वेब डेटा को बड़े पैमाने पर प्रोग्राम के हिसाब से ढूंढ सकते हैं, फ़ेच कर सकते हैं, पार्स कर सकते हैं, और स्ट्रक्चर कर सकते हैं. ये टूल, वेब स्क्रैपिंग की मुश्किल प्रोसेस को आसान बनाते हैं. साथ ही, वेब पर मौजूद बिना स्ट्रक्चर वाले कॉन्टेंट को साफ़-सुथरे और इस्तेमाल किए जा सकने वाले डेटा में बदलते हैं.

इसके लिए, Firecrawl अपने मुख्य एक्सट्रैक्शन इंजन को बेहतर बनाने के लिए, Gemini 2.5 Pro का इस्तेमाल करता है. Gemini के मॉडल, भाषा को बेहतर तरीके से समझने और गहराई से विश्लेषण करने की क्षमता रखते हैं. इससे अलग-अलग तरह के वेब कॉन्टेंट को सटीक तरीके से पार्स किया जा सकता है.

वेब पर मौजूद अव्यवस्थित डेटा को इस्तेमाल किए जा सकने वाले डेटा में बदलना

Firecrawl का मकसद, पूरे वेब को एआई सिस्टम के लिए ऐक्सेस किया जा सकने वाला बनाना है. नियमों पर आधारित वेब स्क्रैपिंग के पारंपरिक तरीके अक्सर भरोसेमंद नहीं होते. साथ ही, वेबसाइट के स्ट्रक्चर में बार-बार बदलाव होने की वजह से, इन्हें लगातार अपडेट करते रहना पड़ता है. Firecrawl को एक ऐसे समाधान की ज़रूरत थी जो कॉन्टेक्स्ट को समझ सके और भरोसेमंद तरीके से डेटा निकाल सके. भले ही, डेटा अलग-अलग सोर्स से लिया गया हो.

Firecrawl ने Gemini 2.5 Pro का इस्तेमाल करके दो मुख्य प्रॉडक्ट बनाए हैं:

  • SmartScrape: यह डेटा निकालने वाला टूल है. यह Gemini 2.5 Pro की भाषा समझने और तर्क करने की क्षमताओं का इस्तेमाल करके, रॉ एचटीएमएल को स्ट्रक्चर्ड आउटपुट में बदलता है. जैसे, JSON या कुंजी-वैल्यू पेयर. यह कॉन्टेक्स्ट के हिसाब से जानकारी निकालता है. साथ ही, यह पेज पर डेटा की जगह के बजाय, उपयोगकर्ता के तय किए गए लक्ष्यों के हिसाब से डेटा का मतलब समझता है.
  • FIRE-1: यह एक्सपेरिमेंट के तौर पर उपलब्ध एजेंट फ़्रेमवर्क है. यह Gemini 2.5 Pro का इस्तेमाल करके, उपयोगकर्ता के इरादे को समझता है, वेब कॉन्टेंट को नेविगेट करता है, और लाइव वेब डेटा के आधार पर आउटपुट जनरेट करता है.


Gemini 2.5 Pro को अपनाने से पहले, Firecrawl ने कई बेहतरीन मॉडल का आकलन किया. उन्होंने पाया कि अन्य मॉडल, प्रोडक्शन स्केल पर असली दुनिया के वेब कॉन्टेंट की जटिलता और बदलावों को मैनेज करने में मुश्किलों का सामना करते हैं.

Firecrawl के सह-संस्थापक एरिक सिएर्ला ने कहा,"Gemini 2.5 Pro की मदद से, पूरे प्रोजेक्ट को पूरा करना आसान हो गया." "Gemini 2.5 Pro का इस्तेमाल करने से पहले, हमने जिन मॉडल को टेस्ट किया था वे वेब पर मौजूद कॉन्टेंट से जानकारी निकालने और उस पर तर्क करने के लिए, ज़रूरी जटिलता को भरोसेमंद तरीके से हैंडल नहीं कर सके. Gemini 2.5 Pro में तर्क करने, सटीक जवाब देने, और भरोसेमंद तरीके से काम करने की क्षमता है. इसलिए, हम कॉन्फ़िडेंस के साथ आगे बढ़ पाए."

टूल कॉलिंग की सुविधा के साथ Gemini 2.5 Pro को लागू करना

Firecrawl ने Gemini 2.5 Pro को अपने प्रॉडक्ट में करीब एक हफ़्ते में इंटिग्रेट कर लिया. ये अपने एजेंट आर्किटेक्चर में, मॉडल की तर्क करने और टूल कॉल करने की क्षमताओं का इस्तेमाल करते हैं.

FIRE-1 एजेंट फ़्रेमवर्क में, मॉडल एक एजेंट लूप के अंदर काम करता है. यह लूप, Gemini 2.5 Pro की तर्क क्षमता को कंट्रोल फ़्लो के साथ जोड़ता है. यह प्रोसेस इस तरह काम करती है:

  • इनपुट: एजेंट को वेबपेज का दस्तावेज़ ऑब्जेक्ट मॉडल (डीओएम) और उपयोगकर्ता का तय किया गया लक्ष्य मिलता है. उदाहरण के लिए, "मुझे इस वेबसाइट के सभी पेज दिखाओ").
  • वजह: Gemini 2.5 Pro, इनपुट का विश्लेषण करता है और ज़रूरी कार्रवाइयां तय करता है.
  • कार्रवाई करना: मॉडल, टूल कॉलिंग (फ़ंक्शन कॉल) के ज़रिए इन कार्रवाइयों को पूरा करता है. नेविगेशन से जुड़े टास्क के लिए, एजेंट ज़रूरी डेटा पाने के लिए, क्लिक(next_page) जैसे फ़ंक्शन अपने-आप चालू कर सकता है.


इस तरीके से, Firecrawl को वेब नेविगेशन और डेटा निकालने जैसे मुश्किल काम करने में मदद मिलती है. इन कामों के लिए, फ़्लेक्सिबिलिटी और अनुमान लगाने की क्षमता, दोनों की ज़रूरत होती है.

डेटा को 98% सटीकता के साथ निकालने की सुविधा

इंटरनल बेंचमार्क में, Gemini 2.5 Pro ने अन्य मॉडल की तुलना में, जानकारी निकालने और वेब पार्सिंग को सटीक तरीके से करने में बेहतर परफ़ॉर्म किया. Firecrawl ने इन मॉडल का आकलन किया था.

Firecrawl के इंटरनल आकलन में, Gemini 2.5 Pro ने 98% सटीकता हासिल की है. टेस्ट किए गए दूसरे सबसे अच्छे मॉडल की सटीकता करीब 80% थी. परफ़ॉर्मेंस में हुई इस बढ़ोतरी से, एक्सट्रैक्शन के बेहतर नतीजे मिले. साथ ही, प्रोडक्शन वर्कलोड में एजेंट के व्यवहार में ज़्यादा भरोसेमंद तरीके से काम करने की क्षमता बढ़ी.

सिएर्ला ने कहा, "हमने इंटरनल टेस्टिंग में पाया कि Gemini 2.5 Pro, हमारे इस्तेमाल के उदाहरण के लिए हर मुख्य डाइमेंशन में, अन्य एआई मॉडल से बेहतर परफ़ॉर्म करता है. जैसे, जानकारी निकालने की सटीक क्षमता, जटिल तर्क, लेटेन्सी, और कुल थ्रूपुट."

वेब इंटरैक्शन को बेहतर बनाना

Gemini मॉडल अब Firecrawl के एआई इन्फ़्रास्ट्रक्चर का एक बुनियादी हिस्सा हैं. इससे, वे एआई प्रॉडक्ट के लिए भरोसेमंद वेब डेटा पाइपलाइन उपलब्ध करा पाते हैं.

फ़िलहाल, Firecrawl ऐसे इस्तेमाल के उदाहरणों के लिए Gemini 2.5 Flash का आकलन कर रहा है जिनमें बहुत कम समय में जवाब देने की ज़रूरत होती है. साथ ही, रीयल-टाइम में एजेंट के साथ इंटरैक्शन करना ज़रूरी होता है. Gemini मॉडल फ़ैमिली के बेहतर होने के साथ-साथ, Firecrawl नई क्षमताओं को इंटिग्रेट करने का प्लान बना रहा है. इससे एआई एजेंट, वेब पर मौजूद असल डेटा के साथ बेहतर तरीके से इंटरैक्ट कर पाएंगे.

अपने ऐप्लिकेशन बनाना शुरू करने के लिए, हमारे एपीआई दस्तावेज़ में Gemini मॉडल की क्षमताओं के बारे में जानें.