هوش مصنوعی سنگاپور با Gemma 2، هوش مصنوعی را برای آسیای جنوب شرقی فراگیرتر می کند
AI سنگاپور که در سال 2017 راه اندازی شد، یک شبکه ملی از موسسات و سازمان های تحقیقاتی هوش مصنوعی است که به پیشبرد توسعه هوش مصنوعی سنگاپور اختصاص دارد. یکی از پروژههای آن، SEA-LION ، خانوادهای از مدلهای باز است که قدرت LLM را به کشورهای جنوب شرقی آسیا (SEA) میآورد که قبلاً توسط دنیای هوش مصنوعی نادیده گرفته شده بودند.
تیم SEA-LION Gemma، خانواده مدلهای باز سبک وزن و کارآمد گوگل را برای واژگان و درک زبانی و همچنین نسبت اندازه به عملکرد آن انتخاب کرد. با Gemma، توسعه دهندگان SEA-LION یک LLM قدرتمند، کارآمد و قابل دسترس ایجاد کردند که امروزه توسط میلیون ها نفر در منطقه دریای دریا مورد استفاده قرار می گیرد.
چالش
تیم SEA-LION تشخیص داد که بسیاری از زبانهایی که در سرتاسر منطقه صحبت میشوند توسط محبوبترین LLMهای امروزی نشان داده نمیشوند، و این بدان معناست که بخشهایی از منطقه و کل گروههای مردم به بسیاری از برنامههای کاربردی بالقوه هوش مصنوعی دسترسی کم یا اصلاً نداشتند. این تیم همچنین دریافت که حتی زمانی که این LLM های اصلی درکی از زبان های محلی SEA داشتند، LLM ها فاقد درک تفاوت های زبانی و فرهنگی شناخته شده برای گویشوران بومی بودند.
همانطور که ویلیام تیجی، رئیس هوش مصنوعی در AI سنگاپور توضیح میدهد، بیشتر هوش مصنوعی جهان بر اساس زبانهای غربی و شرقی ساخته شده است، به این معنی که بسیاری از موارد را میتوان در ترجمه از دست داد: «چشمانداز جهانی LLM حول دو بدن تکامل یافته است: ساحل غربی و چین. این مدلها منعکسکننده جهانبینیهای مبتنی بر مجموعه دادههایی هستند که آنها را آموزش میدهند و زبانهایی که آنها را آموزش میدهند.»
"Gemma's Tokenizer زمانی که برای زبان هایی که در منطقه خود داریم استفاده شود، عملکرد بهتری دارد. می توانید آن را در خروجی مشاهده کنید. این کارکرد مدل را در هنگام آموزش روی توکنهای SEA بسیار افزایش میدهد، زیرا توکنایزر در مقایسه با توکنایزر مدلهای دیگر بهینهتر است.
راه حل
تیم SEA-LION مجموعه ای فراگیر از LLM ها را ایجاد کرد که به دقت تفاوت های ظریف، زمینه ها و تنوع فرهنگی منطقه را منعکس می کند. برای ایجاد یک LLM مناسب با درک واقعی از مجموعه کاملاً جدیدی از زبانها، تیم به دادههای آموزشی متنوع و با کیفیت بالا نیاز داشت، بنابراین تصمیم گرفتند با تیمهای Google DeepMind & Research همکاری کنند. آنها همچنین با سخنرانان بومی و زبان شناسان کار کردند تا داده های نامربوط که از منابعی مانند محتوای قمار و تبلیغات دریافت می شد را فیلتر کنند و از ترجمه های دقیق و با صدای طبیعی اطمینان حاصل کنند.
آخرین تکرار این تیم، SEA-LION V3، به طور مداوم در Gemma 2 با استفاده از 200 میلیارد توکن داده SEA از قبل آموزش داده شد. تیم متوجه شد که توکنایزر Gemma نه تنها حاوی توکن های بیشتری برای زبان های مورد نظر است، بلکه عملکرد بهتری نسبت به مدل های دیگر دارد. نسخه 9 میلیارد پارامتری Gemma به دلیل اندازه و کارایی آن انتخاب شد، زیرا منابع مورد نیاز برای اجرای مدلهای مقیاس بزرگتر در بسیاری از نقاط منطقه محدود است.

تاثیر
SEA-LION V3 پیشرفته ترین تکرار این تیم تاکنون است و دیگر توسعه دهندگان و محققان محلی هوش مصنوعی در حال حاضر از آن استفاده می کنند. شرکت فناوری GoTo اخیراً Sahabat-AI را راه اندازی کرده است ، یک اکوسیستم LLM که بر روی SEA-LION برای توسعه دهندگان اندونزیایی ساخته شده است. Sahabat-AI در دستیار صوتی Dira AI GoTo یکپارچه شده است و به کاربران امکان می دهد به هر دو سرویس پرداخت Gojek و GoPay با دستورات صوتی به زبان ها و گویش های مادری دسترسی داشته باشند.
پاتریک والوجو، مدیرعامل GoTo گفت که انتظار دارد Sahabat-AI تأثیر مثبتی بر زندگی میلیونها نفر در اندونزی بگذارد: «این به کسبوکارهای ما کمک میکند تا به روشهای جدید با مشتریان ارتباط برقرار کنند، به وزارتخانههای دولتی ما کمک میکند ابزارهایی را برای تعامل بیشتر با شهروندان توسعه دهند.»
11
مهارت های زبان آسیای جنوب شرقی
14k+
بارگیری در صورت در آغوش گرفته
38 میلیون
کاربران فعال ماهانه در GoPay به Dira دسترسی دارند
بعدش چی
تیم هوش مصنوعی سنگاپور در حال برنامه ریزی برای تکرار بعدی SEA-LION است. هدف آنها ایجاد نسخههای پارامتری کوچکتر و بزرگتر با استفاده از Gemma است که به طیف گستردهتری از موارد استفاده میپردازد و به جوامع محلی انعطافپذیری بیشتری ارائه میدهد. موفقیت SEA-LION برای رونق هوش مصنوعی SEA ضروری بوده است و سایر LLM هایی که بر روی آن ساخته می شوند، مانند Sahabat-AI، تازه شروع کار هستند.
راه اندازی SEA-LION v3 جدید مبتنی بر Gemma با هوش مصنوعی سنگاپور نشان دهنده یک گام بزرگ رو به جلو برای هوش مصنوعی فراگیر است. مانیش گوپتا، مدیر ارشد Google DeepMind گفت: با استفاده از قدرت جما 2 گوگل، این مدل جدید به طور قابل توجهی از نسخه های قبلی در طیفی از معیارهای ارزیابی آسیای جنوب شرقی بهتر عمل می کند. "ما مشتاقانه منتظر برنامه های هیجان انگیزی هستیم که این قفل را باز می کند و مزایایی که برای جوامع مختلف در سراسر جنوب شرقی آسیا به همراه دارد."