2026 年 10 月 16 日
Firecrawl 使用 Gemini 2.5 Pro 整理網頁資料,供 AI 應用程式使用

檢索增強生成 (RAG) 系統和自主代理程式等 AI 應用程式,越來越需要存取網路上的即時資訊。不過,網頁內容通常是非結構化、動態且不一致,因此開發人員要可靠地擷取資料,面臨的挑戰相當大。
Firecrawl 是以 AI 為優先的網路資料平台,提供 API 讓開發人員和 AI 系統以程式輔助的方式,大規模尋找、擷取、剖析及建構網路資料。這類工具可簡化傳統網頁資料擷取的複雜性,將非結構化網頁內容轉換為乾淨實用的資料。
為此,Firecrawl 使用 Gemini 2.5 Pro 做為核心擷取引擎的動力來源。Gemini 模型具備進階語言理解和推理能力,可準確剖析各種不規則的網頁內容。
將非結構化網路轉換為可用資料
Firecrawl 的目標是讓 AI 系統存取整個網路。傳統的網頁擷取方法通常是以規則為基礎,但網站結構經常變動,因此這些方法往往不穩定,需要持續維護。Firecrawl 需要的解決方案必須能夠理解脈絡,並從高度多變的來源中可靠地擷取資料。
Firecrawl 使用 Gemini 2.5 Pro 開發了兩項核心產品:
- SmartScrape:這項擷取工具會運用 Gemini 2.5 Pro 的語言理解和推理能力,將原始 HTML 轉換為結構化輸出內容,例如 JSON 或鍵/值組合。這項功能會執行情境感知擷取作業,瞭解資料相對於使用者指定目標的意義,而不只是資料在網頁上的位置。
- FIRE-1:實驗性代理程式架構,使用 Gemini 2.5 Pro 解讀使用者意圖、瀏覽網頁內容,並根據即時網頁資料生成輸出內容。
在採用 Gemini 2.5 Pro 之前,Firecrawl 評估了多個頂尖模型。他們發現,其他模型難以在生產規模下處理真實世界網頁內容的複雜性和多變性。
「Gemini 2.5 Pro 讓整個專案成為可能。」Firecrawl 共同創辦人 Eric Ciarla 表示。「在採用 Gemini 2.5 Pro 之前,我們測試的模型無法可靠地處理複雜程度,從真實網頁內容中擷取資訊並進行推理。Gemini 2.5 Pro 的推理能力、準確度和穩定性,讓我們有信心繼續前進。」
透過工具呼叫功能導入 Gemini 2.5 Pro
Firecrawl 大約在一週內,就將 Gemini 2.5 Pro 整合到自家產品中。他們在代理架構中運用模型的推理和工具呼叫功能。
在 FIRE-1 代理程式架構中,模型會在代理程式迴圈中運作,結合 Gemini 2.5 Pro 的推理能力和決定性控制流程。程序如下:
- 輸入:代理程式會收到網頁文件物件模型 (DOM) 和定義的使用者目標 (例如「get me all the pages on this website」)。
- 推理:Gemini 2.5 Pro 會分析輸入內容,判斷必要的動作。
- 執行:模型會透過工具呼叫 (函式呼叫) 執行這些動作。在導覽工作方面,代理程式可能會自主叫用 click(next_page) 等函式,以擷取所需資料。
這種方法可讓 Firecrawl 處理複雜的網頁導覽和擷取工作,同時兼顧彈性和可預測性。
擷取準確率達 98%
在比較擷取準確度和複雜網頁剖析的內部基準中,Gemini 2.5 Pro 的表現明顯優於 Firecrawl 評估的其他模型。
在 Firecrawl 的內部評估中,Gemini 2.5 Pro 的準確率達到 98%。測試的次佳模型準確率約為 80%。這項效能提升直接轉化為更高品質的擷取輸出內容,以及在實際工作負載中更可靠的代理程式行為。
「在內部測試中,Gemini 2.5 Pro 在各項主要指標的表現都優於替代方案,包括擷取準確度、複雜推理、延遲和整體輸送量。」Ciarla 說道。
打造未來的網頁互動體驗
Gemini 模型現在是 Firecrawl AI 基礎架構的基礎元件,可為 AI 產品提供可靠的網路資料管道。
Firecrawl 目前正在評估 Gemini 2.5 Flash,是否適用於需要極低延遲時間的用途,因為即時的代理互動至關重要。隨著 Gemini 模型系列不斷演進,Firecrawl 預計會整合新功能,進一步提升 AI 代理程式與現實世界網路資料的互動方式。
如要開始建構自己的應用程式,請參閱 API 說明文件,瞭解 Gemini 模型的各項功能。