AI Singapore ส่งเสริมให้ AI ครอบคลุมผู้ใช้ในเอเชียตะวันออกเฉียงใต้มากขึ้นด้วย Gemma 2
AI Singapore เปิดตัวในปี 2017 เป็นเครือข่ายสถาบันและองค์กรวิจัย AI ระดับประเทศที่มุ่งพัฒนา AI ของสิงคโปร์ หนึ่งในโปรเจ็กต์ของทีมนี้คือ SEA-LION ซึ่งเป็นกลุ่มโมเดลแบบเปิดที่นําประสิทธิภาพของ LLM มาใช้กับประเทศในเอเชียตะวันออกเฉียงใต้ (SEA) ซึ่งโลกของ AI มองข้ามไปก่อนหน้านี้
ทีมที่อยู่เบื้องหลัง SEA-LION เลือก Gemma ซึ่งเป็นโมเดลแบบเปิดที่มีประสิทธิภาพและน้ำหนักเบาของ Google เนื่องจากมีความเข้าใจด้านคําศัพท์และภาษา รวมถึงอัตราส่วนขนาดต่อประสิทธิภาพ Gemma ช่วยให้นักพัฒนาซอฟต์แวร์ของ SEA-LION สามารถสร้าง LLM ที่มีประสิทธิภาพ เข้าถึงได้ และมีประสิทธิภาพ ซึ่งผู้คนหลายล้านคนในภูมิภาคเอเชียตะวันออกเฉียงใต้ใช้อยู่ในปัจจุบัน
ความท้าทาย
ทีม SEA-LION ตระหนักดีว่าภาษาจำนวนมากที่ผู้คนพูดในภูมิภาคนี้ไม่มีตัวแทนใน LLM ที่ได้รับความนิยมสูงสุดในปัจจุบัน ซึ่งหมายความว่าบางส่วนของภูมิภาคและกลุ่มคนทั้งกลุ่มเข้าถึงแอปพลิเคชัน AI ที่มีศักยภาพได้น้อยหรือไม่ได้เลย นอกจากนี้ ทีมยังพบว่าแม้ LLM หลักเหล่านี้จะมีความเข้าใจพื้นฐานเกี่ยวกับภาษาท้องถิ่นในเอเชียตะวันออกเฉียงใต้ แต่ LLM เหล่านั้นก็ยังไม่เข้าใจความแตกต่างทางภาษาและวัฒนธรรมที่เจ้าของภาษาทราบ
ตามที่ William Tjhi หัวหน้าฝ่ายปัญญาประดิษฐ์ (AI) ของ AI Singapore อธิบายว่า AI ส่วนใหญ่ของโลกสร้างขึ้นจากภาษาตะวันตกและตะวันออก ซึ่งหมายความว่าการแปลอาจทำให้ข้อมูลจำนวนมากสูญหายได้ "ภาพรวม LLM ทั่วโลกพัฒนาขึ้นจาก 2 แหล่ง ได้แก่ ชายฝั่งตะวันตกของสหรัฐอเมริกาและจีน โมเดลเหล่านี้แสดงถึงมุมมองโลกเหล่านั้นโดยอิงตามชุดข้อมูลที่ใช้ในการฝึกและภาษาที่ใช้ฝึก
"Tokenizer ของ Gemma มีประสิทธิภาพดีกว่าเมื่อใช้กับภาษาที่เรามีในภูมิภาค คุณจะเห็นข้อมูลดังกล่าวในเอาต์พุต ซึ่งช่วยเพิ่มประสิทธิภาพของโมเดลได้อย่างมากเมื่อฝึกด้วยโทเค็น SEA เนื่องจากตัวแยกวิเคราะห์มีประสิทธิภาพมากกว่าตัวแยกวิเคราะห์ของโมเดลอื่นๆ"
การแก้ปัญหา
ทีม SEA-LION ได้สร้างชุด LLM ที่ครอบคลุมซึ่งสะท้อนถึงความแตกต่าง บริบท และความหลากหลายทางวัฒนธรรมของภูมิภาคอย่างถูกต้อง ในการสร้าง LLM ที่เหมาะสมซึ่งเข้าใจภาษาชุดใหม่อย่างแท้จริง ทีมต้องการข้อมูลการฝึกอบรมคุณภาพสูงที่หลากหลาย จึงตัดสินใจร่วมมือกับทีม DeepMind และทีมวิจัยของ Google นอกจากนี้ ทีมดังกล่าวยังทำงานร่วมกับเจ้าของภาษาและนักภาษาศาสตร์เพื่อกรองข้อมูลที่ไม่เกี่ยวข้องซึ่งมาจากแหล่งที่มาต่างๆ เช่น เนื้อหาการพนันและโฆษณา และเพื่อให้มั่นใจว่าคำแปลจะถูกต้องและเป็นธรรมชาติ
เวอร์ชันล่าสุดของทีมคือ SEA-LION V3 ได้รับการฝึกล่วงหน้าอย่างต่อเนื่องใน Gemma 2 โดยใช้ข้อมูล SEA โทเค็น 200,000 ล้านรายการ ทีมพบว่า Tokenizer ของ Gemma ไม่เพียงมีโทเค็นสำหรับภาษาที่ต้องการมากกว่า แต่ยังมีประสิทธิภาพดีกว่าโมเดลอื่นๆ ด้วย เราได้เลือกเวอร์ชันพารามิเตอร์ 9, 000 ล้านรายการของ Gemma เนื่องจากขนาดและประสิทธิภาพของเวอร์ชันนี้ เนื่องด้วยทรัพยากรที่จําเป็นในการใช้งานโมเดลขนาดใหญ่อาจจํากัดในหลายพื้นที่ของภูมิภาค

ผลลัพธ์
SEA-LION V3 เป็นเวอร์ชันที่ล้ำหน้าที่สุดของทีม และนักพัฒนาและนักวิจัย AI ท้องถิ่นรายอื่นๆ กำลังใช้เวอร์ชันนี้อยู่ เมื่อไม่นานมานี้ บริษัทเทคโนโลยี GoTo ได้เปิดตัว Sahabat-AI ซึ่งเป็นระบบนิเวศ LLM ที่สร้างขึ้นบน SEA-LION สำหรับนักพัฒนาแอปชาวอินโดนีเซีย Sahabat-AI ผสานรวมกับ Dira AI ซึ่งเป็นผู้ช่วยเสียงของ GoTo ซึ่งช่วยให้ผู้ใช้เข้าถึงบริการการชำระเงินของทั้ง Gojek และ GoPay ด้วยคำสั่งเสียงในภาษาและภาษาถิ่นของตนได้
Patrick Walujo ซีอีโอของ GoTo กล่าวว่าเขาคาดหวังว่า Sahabat-AI จะสร้างผลกระทบเชิงบวกต่อชีวิตผู้คนหลายล้านคนในอินโดนีเซีย โดยกล่าวว่า "เครื่องมือนี้จะช่วยให้ธุรกิจของเราสื่อสารกับลูกค้าด้วยวิธีใหม่ๆ และช่วยให้กระทรวงต่างๆ ของรัฐบาลพัฒนาเครื่องมือเพื่อมีส่วนร่วมกับประชาชนได้อย่างครอบคลุมมากขึ้น"
11
ความเชี่ยวชาญด้านภาษาเอเชียตะวันออกเฉียงใต้
1.4 หมื่นขึ้นไป
การดาวน์โหลดใน Hugging Face
38 ล้าน
ผู้ใช้ที่ใช้งานอยู่รายเดือนใน GoPay จะมีสิทธิ์เข้าถึง Dira
สิ่งที่จะเกิดขึ้นหลังจากนี้
ทีม AI Singapore กำลังวางแผนการปรับปรุง SEA-LION รุ่นถัดไป เป้าหมายของพวกเขาคือการสร้างพารามิเตอร์เวอร์ชันขนาดเล็กและขนาดใหญ่โดยใช้ Gemma เพื่อรองรับกรณีการใช้งานที่หลากหลายมากขึ้นและมอบความยืดหยุ่นที่มากขึ้นให้กับชุมชนท้องถิ่น ความสำเร็จของ SEA-LION เป็นปัจจัยสําคัญที่ทำให้เกิดการเติบโตของ AI ในเอเชียตะวันออกเฉียงใต้ และ LLM อื่นๆ ที่สร้างขึ้นจาก SEA-LION เช่น Sahabat-AI เป็นเพียงจุดเริ่มต้นเท่านั้น
"การเปิดตัว SEA-LION v3 เวอร์ชันใหม่ที่ใช้ Gemma กับ AI Singapore เป็นก้าวสำคัญสำหรับ AI ที่ครอบคลุม โมเดลใหม่นี้มีประสิทธิภาพดีกว่าเวอร์ชันก่อนหน้าอย่างมากในเมตริกการประเมินต่างๆ ของเอเชียตะวันออกเฉียงใต้ จากการใช้ประโยชน์จากความสามารถของ Gemma 2 ของ Google" Manish Gupta ซึ่งเป็นผู้อำนวยการอาวุโสของ Google DeepMind กล่าว "เราหวังว่าแอปพลิเคชันที่น่าตื่นเต้นนี้จะเปิดโอกาสและสร้างประโยชน์ให้กับชุมชนที่หลากหลายทั่วทั้งเอเชียตะวันออกเฉียงใต้"