Gemma 3 modeline genel bakış

Gemma, üretken yapay zeka (AI) modellerinden oluşan bir ailedir. Bu modelleri soru yanıtlama, özetleme ve akıl yürütme gibi çeşitli oluşturma görevlerinde kullanabilirsiniz. Gemma modelleri açık ağırlıklarla sağlanır ve sorumlu ticari kullanıma izin verir. Böylece, bunları kendi proje ve uygulamalarınızda ayarlayabilir ve dağıtabilirsiniz.

Gemma 3 sürümü aşağıdaki temel özellikleri içerir. AI Studio'da deneyin:

Gemma 3 modellerini Kaggle ve Hugging Face'ten indirebilirsiniz. Gemma 3 ile ilgili daha fazla teknik bilgi için Model Kartı'na ve Teknik Rapor'a bakın. Gemma temel modellerinin önceki sürümleri de indirilebilir. Daha fazla bilgi için Önceki Gemma modelleri başlıklı makaleyi inceleyin.

Gemma 3'ü deneyin Kaggle'den indirin Hugging Face'ten indirin

Çok modlu resim ve metin girişi

Gemma 3, resim ve metin verilerini işleyebilme özelliğiyle daha karmaşık analiz ve oluşturma görevleriyle başa çıkabilir. Görüntü verilerini yorumlamak, nesneleri tanımlamak, metin verilerini ayıklamak ve görsel girişten metin çıktısına yönelik diğer birçok görevi tamamlamak için modeli kullanabilirsiniz. Oluşturmaya başlama

128.000 jetonluk bağlam penceresi

Gemma 3 modelleri, önceki Gemma modellerine kıyasla 16 kat daha büyük bir bağlam penceresi olan 128.000 jetona kadar istem girişini işleyebilir. Çok sayıda jeton, tek bir istemde birden fazla çok sayfalı makale, daha büyük tek makaleler veya yüzlerce resim işleyebileceğiniz anlamına gelir.

Geniş dil desteği

140'tan fazla dil için yerleşik destek sayesinde kendi dilinizde çalışın. Gemma 3, önceki Gemma sürümlerine kıyasla çok sayıda dili desteklemek için eğitilmiştir. Böylece müşterilerinizin kullandığı dillerde daha fazla görsel ve metin görevi alabilirsiniz. Oluşturmaya başlama

Parametre boyutları ve kesirli sayılaştırma

Gemma 3 modelleri, 32 bit tam hassasiyetten 4 bit en düşük hassasiyete kadar 5 hassasiyet düzeyinde 4 parametre boyutunda mevcuttur. Farklı boyutlar ve hassasiyetler, yapay zeka uygulamanız için bir dizi dengeyi temsil eder. Daha yüksek parametre ve bit sayısına (daha yüksek hassasiyet) sahip modeller genellikle daha yeteneklidir ancak işlem döngüleri, bellek maliyeti ve güç tüketimi açısından çalıştırmaları daha pahalıdır. Daha az parametre ve bit sayısına (daha düşük hassasiyet) sahip modeller daha az kapasiteye sahiptir ancak yapay zeka göreviniz için yeterli olabilir. Aşağıdaki tabloda, Gemma 3 model sürümlerinin her boyutunda çıkarım çalıştırmak için yaklaşık GPU veya TPU bellek gereksinimleri ayrıntılı olarak açıklanmıştır.

Parametreler Tam 32 bit BF16 (16 bit) SFP8
(8 bit)
Q4_0
(4 bit)
INT4
(4 bit)
Gemma 3 1B (yalnızca metin) 4 GB 1,5 GB 1,1 GB 892 MB 861 MB
Gemma 3 4B 16 GB 6,4 GB 4,4 GB 3,4 GB 3,2 GB
Gemma 3 12B 48 GB 20 GB 12,2 GB 8,7 GB 8,2 GB
Gemma 3 27B 108 GB 46,4 GB 29,1 GB 21 GB 19,9 GB

Tablo 1. Parametre sayısına ve kesme düzeyine (bit derinliği) göre Gemma 3 modellerini yüklemek için gereken yaklaşık GPU veya TPU belleği.

Bellek tüketimi, çalıştırdığınız istem için gereken toplam jeton sayısına göre artar. İsteminizi işlemek için gereken jeton sayısı ne kadar yüksekse modelin yüklenmesi için gereken belleğe ek olarak gereken bellek de o kadar yüksek olur.

Önceki Gemma modelleri

Kaggle ve Hugging Face'ta da bulunan önceki nesil Gemma modelleriyle çalışabilirsiniz. Önceki Gemma modelleri hakkında daha fazla teknik bilgi için aşağıdaki model kartı sayfalarına bakın:

Uygulamanızı oluşturmaya hazır mısınız? Gemma modellerini kullanmaya başlayın.