Paylaş

AI Singapore, Gemma 2 ile Güneydoğu Asya için yapay zekayı daha kapsayıcı hale getiriyor

2017'de kurulan AI Singapore, Singapur'un yapay zeka gelişimini ilerletmeye adanmış ulusal bir yapay zeka araştırma kurumu ve kuruluşları ağıdır. Projelerinden biri olan SEA-LION, LLM'lerin gücünü daha önce yapay zeka dünyasının göz ardı ettiği Güneydoğu Asya (SEA) ülkelerine getiren açık modellerden oluşan bir ailedir.

SEA-LION'un arkasındaki ekip, Google'ın hafif ve verimli açık modelleri ailesinden Gemma'yı kelime hazinesi ve dil bilgisinin yanı sıra boyut/performans oranı nedeniyle tercih etti. SEA-LION geliştiricileri, Gemma ile Güneydoğu Asya bölgesinde milyonlarca kişi tarafından kullanılan güçlü, verimli ve erişilebilir bir LLM oluşturdu.

Yarışma

SEA-LION ekibi, bölgede konuşulan dillerin çoğunun günümüzün en popüler LLM'leri tarafından temsil edilmediğini fark etti. Bu da bölgenin bazı bölümlerinin ve bazı insan gruplarının yapay zekanın potansiyel uygulamalarının çoğuna erişimi olmadığı veya bu erişimin çok az olduğu anlamına geliyordu. Ekip, bu ana akım LLM'lerin yerel Güneydoğu Asya dilleri hakkında temel bir bilgiye sahip olsalar bile ana dili konuşan kişiler tarafından bilinen dilsel ve kültürel farklılıkları anlamadıklarını da tespit etti.

AI Singapore'da yapay zeka bölümünün başkanı olan William Tjhi'nin de belirttiği gibi, dünyanın yapay zekasının çoğu Batılı ve Doğu dillerine dayanır. Bu da çeviri sırasında çok fazla bilginin kaybolabileceği anlamına gelir: "Küresel LLM ortamı, iki merkez etrafında gelişti: Batı Kıyısı ve Çin. Bu modeller, onları eğiten veri kümelerine ve dillere dayalı dünya görüşlerini yansıtır."

"Gemma'nın Tokenizer'ı, bölgemizdeki dillere uygulandığında daha iyi performans gösteriyor. Bunu çıkışta görebilirsiniz. Bu, diğer modellerin kelime ayırıcısına kıyasla daha uygun olduğu için SEA jetonlarıyla eğitildiğinde model performansını büyük ölçüde artırır."

— William Tjhi, AI Singapore Yapay Zeka Bölümü Başkanı

Çözüm

SEA-LION ekibi, bölgenin nüanslarını, bağlamlarını ve kültürel çeşitliliğini doğru şekilde yansıtan kapsayıcı bir LLM grubu oluşturdu. Ekip, yeni bir dil grubunu doğru şekilde anlayabilen uygun bir LLM oluşturmak için çeşitli ve yüksek kaliteli eğitim verilerine ihtiyaç duyuyordu. Bu nedenle Google DeepMind ve Araştırma ekipleriyle birlikte çalışmaya karar verdi. Ayrıca kumar içerikleri ve reklamlar gibi kaynaklardan gelen alakasız verileri filtrelemek ve doğru, doğal sesli çeviriler sağlamak için ana dili konuşan kişilerle ve dilbilimcilerle birlikte çalıştılar.

Ekibin en son iterasyonu olan SEA-LION V3, 200 milyar SEA verisi jetonu kullanılarak Gemma 2'de sürekli olarak önceden eğitildi. Ekip, Gemma'nın kelime parçalayıcısının yalnızca amaçlanan diller için daha fazla jeton içermediğini, aynı zamanda diğer modellere kıyasla daha iyi performans gösterdiğini tespit etti. Daha büyük ölçekli modelleri çalıştırmak için gereken kaynaklar bölgenin birçok yerinde sınırlı olabileceğinden, Gemma'nın 9 milyar parametre içeren sürümü boyutu ve verimliliği nedeniyle seçildi.

SEA-LION'un İngilizce Görevler performansı ile SEA Ortalama performansı arasındaki korelasyon.
SEA-LION'un İngilizce Görevler performansı ile SEA Ortalama performansı arasındaki ilişkiyi gösteren karşılaştırmalar.

Etki

SEA-LION V3, ekibin şimdiye kadarki en gelişmiş iterasyonudur ve diğer yerel yapay zeka geliştiricileri ve araştırmacıları tarafından halihazırda kullanılmaktadır. Teknoloji şirketi GoTo, Endonezyalı geliştiriciler için SEA-LION'a dayalı bir LLM ekosistemi olan Sahabat-AI'ı kısa süre önce kullanıma sundu. Sahabat-AI, GoTo'nun Dira AI sesli asistanına entegre edilmiştir. Bu sayede kullanıcılar, yerel dil ve lehçelerde sesli komutlarla hem Gojek hem de GoPay ödeme hizmetlerine erişebilir.

GoTo CEO'su Patrick Walujo, Sahabat-AI'ın Endonezya'da milyonlarca insanın hayatını olumlu yönde etkileyeceğini umduğunu söyledi: "İşletmelerimizin müşterilerle yeni yollarla iletişim kurmasına yardımcı olacak, devlet bakanlıklarımızın vatandaşlarla daha kapsamlı bir şekilde etkileşim kuracak araçlar geliştirmesine yardımcı olacak."

11

Güneydoğu Asya dillerinde yeterlilik

14 bin ve üzeri

Kucak açan yüz emojisi indirme sayısı

38+ Mn

GoPay'de aylık etkin kullanıcılar Dira'ya erişebilir

Sırada ne var?

AI Singapore ekibi, SEA-LION'un bir sonraki iterasyonunu planlamaya başladı. Amaç, Gemma'yı kullanarak daha küçük ve daha büyük parametre sürümleri oluşturmak, daha çeşitli kullanım alanlarına hitap etmek ve yerel topluluklara daha da fazla esneklik sunmaktır. SEA-LION'un başarısı, SEA'nın yapay zeka patlaması için çok önemliydi ve Sahabat-AI gibi bu modelin üzerine inşa edilen diğer LLM'ler bunun sadece başlangıcı.

"AI Singapore ile Gemma tabanlı yeni SEA-LION v3'ün kullanıma sunulması, kapsayıcı yapay zeka için önemli bir adımdır. Google DeepMind Kıdemli Direktörü Manish Gupta, "Bu yeni model, Google'ın Gemma 2'nin gücünden yararlanarak Güneydoğu Asya'daki çeşitli değerlendirme metriklerinde önceki sürümlerden önemli ölçüde daha iyi performans gösteriyor." dedi. "Bu özelliğin sunduğu heyecan verici uygulamaları ve Güneydoğu Asya'daki çeşitli topluluklara sağlayacağı avantajları sabırsızlıkla bekliyoruz."