27 ต.ค. 2025
Raindrop ตรวจสอบประสิทธิภาพของเอเจนต์ AI ในวงกว้างโดยใช้ Gemini 2.5 Flash
เอเจนต์ AI มีความท้าทายในการตรวจสอบที่ไม่เหมือนใครเมื่อเทียบกับซอฟต์แวร์แบบเดิม ความล้มเหลวในระบบ AI มักจะ "เงียบ" ซึ่งหมายความว่าระบบอาจไม่สร้างข้อยกเว้นหรือข้อผิดพลาดมาตรฐาน ซึ่งทำให้ทีมวิศวกรตรวจหาปัญหาได้ยากขึ้น วิธีการแก้ไขข้อบกพร่องแบบเดิม เช่น การกรองบันทึกหรือการพึ่งพาการประเมินก่อนการผลิต อาจไม่สามารถจับปัญหาด้านประสิทธิภาพในโลกแห่งความเป็นจริงได้
Raindrop มีแพลตฟอร์มการตรวจสอบที่ออกแบบมาโดยเฉพาะสำหรับเอเจนต์ AI ในการใช้งานจริง โดยจะช่วยให้ทีมวิศวกรระบุปัญหาที่ซับซ้อน เช่น การเรียกใช้เครื่องมือล้มเหลวและความไม่พอใจของผู้ใช้ ด้วยการประมวลผลสตรีมการโต้ตอบของผู้ใช้จำนวนมาก Raindrop ใช้ Gemini 2.5 Flash ในการจัดหมวดหมู่ สรุป และการจัดอันดับผลการค้นหาใหม่เพื่อให้ไปป์ไลน์การตรวจสอบทำงานได้อย่างมีประสิทธิภาพ
การเปิดใช้การตรวจสอบแบบเรียลไทม์ในวงกว้าง
แพลตฟอร์มของ Raindrop ประมวลผลเหตุการณ์หลายสิบล้านรายการต่อวัน ความท้าทายหลักของ Raindrop คือการช่วยให้ทีมวิศวกรสามารถค้นหาและจัดประเภทปัญหาในชุดข้อมูลขนาดใหญ่เหล่านี้ได้แบบเรียลไทม์ เมื่อผู้ใช้กําหนดปัญหาใหม่ที่จะตรวจสอบ ระบบของ Raindrop ต้องตีความความตั้งใจของผู้ใช้อย่างรวดเร็วและวิเคราะห์สตรีมเหตุการณ์เพื่อค้นหารายการที่ตรงกัน
การประมวลผลที่มีปริมาณงานสูงนี้ต้องใช้โมเดลที่มีเวลาในการตอบสนองต่ำมากและมีประสิทธิภาพด้านต้นทุนสูง Raindrop ต้องการโซลูชันที่จะขับเคลื่อนไปป์ไลน์หลักของ "การตรวจสอบเชิงความหมาย" และฟีเจอร์ใหม่ๆ เช่น Deep Search ซึ่งเป็นเครื่องมือสำหรับค้นคว้าข้อมูล AI ในการผลิต โดยไม่ต้องเสียค่าใช้จ่ายที่สูงเกินไปหรือมีเวลาในการตอบสนองที่ช้าซึ่งจะลดประสบการณ์การใช้งานของผู้ใช้
"เราต้องการโมเดลที่ประมวลผลเหตุการณ์เริ่มต้นเหล่านี้ได้อย่างรวดเร็วในราคาที่สมเหตุสมผล" Ben Hylak ผู้ร่วมก่อตั้งและ CTO ของ Raindrop กล่าว "ความหน่วงต่ำและความอัจฉริยะของ Gemini 2.5 Flash ช่วยให้ผลิตภัณฑ์ Deep Search ของเราใช้งานได้ ซึ่งหากใช้โมเดลอื่นจะใช้งานไม่ได้เนื่องจากช้าเกินไปและมีค่าใช้จ่ายสูงเกินไป"
การใช้งาน Gemini 2.5 Flash เพื่อให้ได้เอาต์พุตที่มีโครงสร้างและรวดเร็ว
Raindrop ผสานรวม Gemini 2.5 Flash เพื่อจัดการการจัดหมวดหมู่และการเขียนคำค้นหาใหม่ การติดตั้งใช้งานได้รับการปรับปรุงโดยใช้ Vercel AI SDK ซึ่งช่วยให้ Raindrop ผสานรวมโมเดลได้อย่างรวดเร็ว
Raindrop ใช้ประโยชน์จาก Gemini 2.5 Flash สำหรับฟังก์ชันหลักหลายอย่าง ดังนี้
- การขยายและการเขียนคำค้นหาใหม่: ในไปป์ไลน์ Deep Search เราใช้ประโยชน์จาก Gemini 2.5 Flash เพื่อเขียนคำค้นหาของผู้ใช้ใหม่เพื่อเพิ่มประสิทธิภาพผลลัพธ์ ซึ่งจะช่วยปรับปรุงความเกี่ยวข้องของการค้นหาในกิจกรรมนับล้าน
- เอาต์พุตที่มีโครงสร้าง: Raindrop ใช้การเรียกใช้เครื่องมือและเอาต์พุตที่มีโครงสร้างเพื่อให้มั่นใจว่าผลลัพธ์จากการโต้ตอบกับโมเดลจะแม่นยำมากขึ้น ความน่าเชื่อถือนี้มีความสําคัญอย่างยิ่งต่อการแก้ไขข้อบกพร่องและการให้ร่องรอยการให้เหตุผลที่ถูกต้องแก่ผู้ใช้
ก่อนที่จะใช้ Gemini 2.5 Flash ทาง Raindrop ได้ประเมินโมเดลขนาดเล็กอื่นๆ แต่พบว่าอัตราส่วนต้นทุนต่อประสิทธิภาพไม่น่าพอใจ "โมเดลอื่นๆ มีราคาแพงเกินไป ช้าเกินไป ไม่ฉลาดพอ หรือไม่สร้างเอาต์พุตที่มีโครงสร้างที่เชื่อถือได้" Hylak กล่าว "อัตราส่วนความอัจฉริยะต่อต้นทุนนั้นสมเหตุสมผลเมื่อใช้ Gemini 2.5 Flash เท่านั้น"
ลดเวลาในการค้นหาและลดต้นทุนได้ 90%
การเปลี่ยนไปใช้โมเดล Gemini 2.5 Flash ทำให้ Raindrop ได้รับประสิทธิภาพและประสิทธิภาพที่เพิ่มขึ้นอย่างมาก
ผลลัพธ์ที่สำคัญ ได้แก่
- ลดเวลาค้นหาจากหลายชั่วโมงเหลือไม่ถึงนาที
- ลดต้นทุนได้มากกว่า 90%
- ความน่าเชื่อถือที่เพิ่มขึ้นทั้งในการประเมินและการตรวจสอบการใช้งานจริง
Raindrop ใช้การรองรับเอาต์พุตที่มีโครงสร้างและการเรียกใช้เครื่องมือของ Gemini API ภายในไปป์ไลน์ Deep Search ซึ่งช่วยให้ได้รับผลลัพธ์ที่ถูกต้องและดูร่องรอยการให้เหตุผลเพื่อการแก้ไขข้อบกพร่อง ซึ่งเป็นสิ่งสำคัญในการรักษาระบบที่เชื่อถือได้ การผสานรวมครั้งแรกเสร็จสมบูรณ์ภายในไม่กี่นาทีโดยใช้ Vercel AI SDK
สร้างอนาคตของการสังเกตการณ์เอเจนต์
Raindrop ยังคงสร้างแพลตฟอร์มการตรวจสอบที่ทำงานบน Agent ด้วยฟีเจอร์ต่างๆ เช่น การติดตามที่สมบูรณ์และการตรวจหาปัญหาการเรียกใช้เครื่องมือโดยอัตโนมัติ โดยเชื่อว่าเมื่อโมเดล AI ทำงานได้เร็วขึ้นและเชื่อถือได้มากขึ้น ตัวแทนจะสามารถจัดการงานที่มีความซับซ้อนมากขึ้นเรื่อยๆ ได้
"นักพัฒนาแอปควรใช้ประโยชน์จากเอาต์พุตที่มีโครงสร้างที่เชื่อถือได้และรูปแบบการกำหนดราคาของ Gemini 2.5 Flash เพื่อเปิดใช้กรณีการใช้งานที่ก่อนหน้านี้อาจคิดว่ามีค่าใช้จ่ายสูงเกินไป" Hylak กล่าว "Gemini 2.5 Flash อาจเปลี่ยนเส้นทางการพัฒนาผลิตภัณฑ์ของคุณได้โดยให้คุณมอบประสบการณ์อัจฉริยะแก่ผู้ใช้ซึ่งสอดคล้องกับรูปแบบการกำหนดราคาของคุณ"
หากต้องการเริ่มสร้างแอปพลิเคชันของคุณเอง โปรดสำรวจความสามารถของโมเดล Gemini ในเอกสารประกอบเกี่ยวกับ API