به اشتراک بگذارید

هوش مصنوعی سنگاپور با Gemma 2، هوش مصنوعی را برای آسیای جنوب شرقی فراگیرتر می کند

AI سنگاپور که در سال 2017 راه اندازی شد، یک شبکه ملی از موسسات و سازمان های تحقیقاتی هوش مصنوعی است که به پیشبرد توسعه هوش مصنوعی سنگاپور اختصاص دارد. یکی از پروژه‌های آن، SEA-LION ، خانواده‌ای از مدل‌های باز است که قدرت LLM را به کشورهای جنوب شرقی آسیا (SEA) می‌آورد که قبلاً توسط دنیای هوش مصنوعی نادیده گرفته شده بودند.

تیم SEA-LION Gemma، خانواده مدل‌های باز سبک وزن و کارآمد گوگل را برای واژگان و درک زبانی و همچنین نسبت اندازه به عملکرد آن انتخاب کرد. با Gemma، توسعه دهندگان SEA-LION یک LLM قدرتمند، کارآمد و قابل دسترس ایجاد کردند که امروزه توسط میلیون ها نفر در منطقه دریای دریا مورد استفاده قرار می گیرد.

چالش

تیم SEA-LION تشخیص داد که بسیاری از زبان‌هایی که در سرتاسر منطقه صحبت می‌شوند توسط محبوب‌ترین LLM‌های امروزی نشان داده نمی‌شوند، و این بدان معناست که بخش‌هایی از منطقه و کل گروه‌های مردم به بسیاری از برنامه‌های کاربردی بالقوه هوش مصنوعی دسترسی کم یا اصلاً نداشتند. این تیم همچنین دریافت که حتی زمانی که این LLM های اصلی درکی از زبان های محلی SEA داشتند، LLM ها فاقد درک تفاوت های زبانی و فرهنگی شناخته شده برای گویشوران بومی بودند.

همانطور که ویلیام تیجی، رئیس هوش مصنوعی در AI سنگاپور توضیح می‌دهد، بیشتر هوش مصنوعی جهان بر اساس زبان‌های غربی و شرقی ساخته شده است، به این معنی که بسیاری از موارد را می‌توان در ترجمه از دست داد: «چشم‌انداز جهانی LLM حول دو بدن تکامل یافته است: ساحل غربی و چین. این مدل‌ها منعکس‌کننده جهان‌بینی‌های مبتنی بر مجموعه داده‌هایی هستند که آنها را آموزش می‌دهند و زبان‌هایی که آنها را آموزش می‌دهند.»

"Gemma's Tokenizer زمانی که برای زبان هایی که در منطقه خود داریم استفاده شود، عملکرد بهتری دارد. می توانید آن را در خروجی مشاهده کنید. این کارکرد مدل را در هنگام آموزش روی توکن‌های SEA بسیار افزایش می‌دهد، زیرا توکنایزر در مقایسه با توکنایزر مدل‌های دیگر بهینه‌تر است.

- ویلیام تیجی، رئیس هوش مصنوعی در AI سنگاپور

راه حل

تیم SEA-LION مجموعه ای فراگیر از LLM ها را ایجاد کرد که به دقت تفاوت های ظریف، زمینه ها و تنوع فرهنگی منطقه را منعکس می کند. برای ایجاد یک LLM مناسب با درک واقعی از مجموعه کاملاً جدیدی از زبان‌ها، تیم به داده‌های آموزشی متنوع و با کیفیت بالا نیاز داشت، بنابراین تصمیم گرفتند با تیم‌های Google DeepMind & Research همکاری کنند. آنها همچنین با سخنرانان بومی و زبان شناسان کار کردند تا داده های نامربوط که از منابعی مانند محتوای قمار و تبلیغات دریافت می شد را فیلتر کنند و از ترجمه های دقیق و با صدای طبیعی اطمینان حاصل کنند.

آخرین تکرار این تیم، SEA-LION V3، به طور مداوم در Gemma 2 با استفاده از 200 میلیارد توکن داده SEA از قبل آموزش داده شد. تیم متوجه شد که توکنایزر Gemma نه تنها حاوی توکن های بیشتری برای زبان های مورد نظر است، بلکه عملکرد بهتری نسبت به مدل های دیگر دارد. نسخه 9 میلیارد پارامتری Gemma به دلیل اندازه و کارایی آن انتخاب شد، زیرا منابع مورد نیاز برای اجرای مدل‌های مقیاس بزرگتر در بسیاری از نقاط منطقه محدود است.

همبستگی بین عملکرد SEA-LION's English Tasks و میانگین عملکرد SEA.
معیارهایی که رابطه بین عملکرد SEA-LION's English Tasks و میانگین عملکرد SEA را ترسیم می کنند.

تاثیر

SEA-LION V3 پیشرفته ترین تکرار این تیم تاکنون است و دیگر توسعه دهندگان و محققان محلی هوش مصنوعی در حال حاضر از آن استفاده می کنند. شرکت فناوری GoTo اخیراً Sahabat-AI را راه اندازی کرده است ، یک اکوسیستم LLM که بر روی SEA-LION برای توسعه دهندگان اندونزیایی ساخته شده است. Sahabat-AI در دستیار صوتی Dira AI GoTo یکپارچه شده است و به کاربران امکان می دهد به هر دو سرویس پرداخت Gojek و GoPay با دستورات صوتی به زبان ها و گویش های مادری دسترسی داشته باشند.

پاتریک والوجو، مدیرعامل GoTo گفت که انتظار دارد Sahabat-AI تأثیر مثبتی بر زندگی میلیون‌ها نفر در اندونزی بگذارد: «این به کسب‌وکارهای ما کمک می‌کند تا به روش‌های جدید با مشتریان ارتباط برقرار کنند، به وزارتخانه‌های دولتی ما کمک می‌کند ابزارهایی را برای تعامل بیشتر با شهروندان توسعه دهند.»

11

مهارت های زبان آسیای جنوب شرقی

14k+

بارگیری در صورت در آغوش گرفته

38 میلیون

کاربران فعال ماهانه در GoPay به Dira دسترسی دارند

بعدش چی

تیم هوش مصنوعی سنگاپور در حال برنامه ریزی برای تکرار بعدی SEA-LION است. هدف آن‌ها ایجاد نسخه‌های پارامتری کوچک‌تر و بزرگ‌تر با استفاده از Gemma است که به طیف گسترده‌تری از موارد استفاده می‌پردازد و به جوامع محلی انعطاف‌پذیری بیشتری ارائه می‌دهد. موفقیت SEA-LION برای رونق هوش مصنوعی SEA ضروری بوده است و سایر LLM هایی که بر روی آن ساخته می شوند، مانند Sahabat-AI، تازه شروع کار هستند.

راه اندازی SEA-LION v3 جدید مبتنی بر Gemma با هوش مصنوعی سنگاپور نشان دهنده یک گام بزرگ رو به جلو برای هوش مصنوعی فراگیر است. مانیش گوپتا، مدیر ارشد Google DeepMind گفت: با استفاده از قدرت جما 2 گوگل، این مدل جدید به طور قابل توجهی از نسخه های قبلی در طیفی از معیارهای ارزیابی آسیای جنوب شرقی بهتر عمل می کند. "ما مشتاقانه منتظر برنامه های هیجان انگیزی هستیم که این قفل را باز می کند و مزایایی که برای جوامع مختلف در سراسر جنوب شرقی آسیا به همراه دارد."