Gemma model kartı

Model Sayfa: Gemma

Kaynaklar ve Teknik Belgeler:

Kullanım Şartları: Şartlar

Yazarlar: Google

Model Bilgisi

Giriş ve çıkışların özet açıklaması ve kısa tanımı.

Açıklama

Gemma; Google'ın basit, son teknoloji ürünü açık modelleri, Gemini modellerini oluşturmak için kullanılan araştırma ve teknolojiyle geliştirilmiştir. Metinden metne ve yalnızca kod çözücüye sahip büyük dil modelleridir. İngilizce, açık ağırlıklar, önceden eğitilmiş varyantlar ve talimatlara göre ayarlanmış varyantlarla. Gemma modellerin yer aldığı çeşitli metin oluşturma görevleri için uygundur: özetlemeyi ve akıl yürütmeyi öğreneceksiniz. Nispeten küçük boyutları Bu sayede, bulut depolama gibi sınırlı kaynaklarla ortamlarda ya da kendi bulut altyapınızı kullanarak herkesin erişebileceği herkes için inovasyonun teşvik edilmesine yardımcı oluyoruz.

Girişler ve çıkışlar

  • Giriş: Metin dizesi (ör. soru, istem veya doküman) özetlenir.
  • Çıkış: Girişe yanıt olarak oluşturulan İngilizce metin. bir yanıt olarak veya bir dokümanın özeti olarak kullanabilirsiniz.

Alıntı

@article{gemma_2024,
    title={Gemma},
    url={https://www.kaggle.com/m/3301},
    DOI={10.34740/KAGGLE/M/3301},
    publisher={Kaggle},
    author={Gemma Team, Thomas Mesnard and Cassidy Hardin and Robert Dadashi and Surya Bhupatiraju and Laurent Sifre and Morgane Rivière and Mihir Sanjay Kale and Juliette Love and Pouya Tafti and Léonard Hussenot and et al.},
    year={2024}
}

Model Verileri

Model eğitimi için kullanılan veriler ve verilerin işlenme şekli.

Eğitim Veri Kümesi

Bu modeller, çok çeşitli metin verileri içeren bir veri kümesi kullanılarak eğitildi toplam 6 trilyon jetona ulaştı. Temel bileşenler şunlardır:

  • Web Dokümanları: Çok çeşitli web metinleri, modelin görünür olmasını sağlar geniş bir yelpazededir. Ağırlıklı olarak İngilizce içerik.
  • Kod: Modeli koda sunmak, modelin söz dizimini ve kalıplarını öğrenmesine veya üçüncü taraf programlaması gibi kodlarla ilgili soruları anlamaya çalışın.
  • Matematik: Matematiksel metin eğitimi, modelin mantıksal öğrenmesine yardımcı olur akıl yürütme, sembolik temsil ve matematiksel sorguları ele alma.

Bu çeşitli veri kaynaklarının birlikte kullanılması, etkili bir çok çeşitli görevleri ve metinleri işleyebilen bir dil modeli biçimlerinden biridir.

Veri Ön İşleme

Eğitimde uygulanan temel veri temizleme ve filtreleme yöntemleri şunlardır: veri:

  • CSAM Filtreleme: Katı CSAM (Çocukların Cinsel İstismarı Nitelikli Materyal) filtresi (önceki değeri) veri hazırlama sürecinin birden çok aşamasında uygulanır. hariç tutmak isteyebilirsiniz.
  • Hassas Veri Filtreleme: Önceden eğitilmiş Gemma modellerini, belirli kişisel verileri filtreleyip hariç tutmak için güvenilir ve otomatik eğitim kümelerindeki tüm hassas verileri ve bilgileri içerir.
  • Ek yöntemler: İçerik kalitesi ve güvenliğine göre filtreleme, politikalarımıza bakın.

Uygulama Bilgileri

Model dahili öğeleriyle ilgili ayrıntılar.

Donanım

Gemma, Arkadaş Bitkiler projesinin Tensor İşleme Birimi (TPU) donanımı (TPUv5e).

Büyük dil modellerinin eğitilmesi, önemli işlem gücü gerektirir. TPU'lar makine öğreniminde yaygın olarak kullanılan matris işlemleri için özel olarak tasarlanmış bazı avantajları vardır:

  • Performans: TPU'lar, devasa hesaplamaları yönetmek için özel olarak tasarlanmıştır. LLM'lerin eğitiminde görev almıştım. Çevik’e kıyasla eğitimi önemli ölçüde hızlandırabilir CPU'lar.
  • Bellek: TPU'lar genellikle yüksek bant genişliğine sahip büyük miktarda bellekle gelir. büyük modellerin ve grup boyutlarının işlenmesine yönelik temel işlemleri yapıyoruz. Bu model kalitesini artırır.
  • Ölçeklenebilirlik: TPU Kapsülleri (büyük TPU kümeleri) şunlar için ölçeklenebilir bir çözüm sunar: ve büyük temel modellerinin giderek daha karmaşık hale gelmesine yardımcı oluyor. Bu bağlantıları, birden fazla TPU cihazı arasında eğitim ile daha hızlı ve verimli bir şekilde çalışın.
  • Uygun maliyet: Birçok senaryoda TPU'lar daha uygun maliyetlidir. büyük modelleri eğitmeye yönelik bir çözüm olan bu çözüm, özellikle de platformdaki tüm araçların yanı sıra bahsedeceğim.
  • Bu avantajlar projenin Google'ın sürdürülebilir çalışma taahhütleri.

Yazılım

Eğitim, JAX ve ML Pathways kullanılarak gerçekleştirildi.

JAX, araştırmacıların en yeni nesil donanım, daha hızlı ve daha verimli eğitim için TPU'ları kullanabilirsiniz.

ML Pathways, Google'ın yapay zeka destekli sistemler geliştirmeye yönelik en son çalışmasıdır birden fazla görevde genelleme yapabilir. Bu yöntem özellikle temel modelleri içerir. Bu modeller, bunları kullanabilirsiniz.

JAX ve ML Yolları birlikte aşağıda açıklandığı gibi kullanılır: Gemini model ailesi hakkında bir makale; "tek denetleyici' Jax ve Pathways'in programlama modeli, tek bir Python'un tüm eğitim çalışmalarının düzenlenmesini sağlar ve süreci büyük ölçüde basitleştirir. bahsedeceğim.

Değerlendirme

Model değerlendirme metrikleri ve sonuçları.

Karşılaştırma Sonuçları

Bu modeller, farklı veri kümelerinden oluşan geniş bir koleksiyonla karşılaştırılarak değerlendirildi metrikleri kullanarak metin oluşturmanın farklı yönlerini ele aldık:

Karşılaştırma Metrik Gemma PT 2B Gemma PT 7B
MMLU 5 çekim, ilk 1 42,3 64,3
HellaSwag 0 Çekim 71,4 81,2
PIQA 0 Çekim 77,3 81,2
SocialIQA 0 Çekim 49,7 51,8
BoolQ 0 Çekim 69,4 83,2
WinoGrande kısmi puan 65,4 72,3
CommonsenseQA 7 Çekim 65,3 71,3
OpenBookQA 47,8 52,8
ARC-e 73,2 81,5
ARC-c 42,1 53,2
TriviaQA 5 Çekim 53,2 63,4
Doğal Sorular 5 Çekim 12,5 23,0
HumanEval kart@1 22,0 32,3
MBPP 3 Çekim 29,2 44,4
GSM8K mehmet@1 17,7 46,4
MATH 4 Çekim 11,8 24,3
AGIEval 24,2 41,7
BIG Bank 35,2 55,1
Ortalama 44,9 56,4

Etik ve Güvenlik

Etik ve güvenlik değerlendirmesi yaklaşımı ve sonuçları.

Değerlendirme Yaklaşımı

Değerlendirme yöntemlerimiz arasında, yapılandırılmış değerlendirmeler ve kurum içi değerlendirmeler yer alır. test edilmesine yardımcı olur. Kırmızı takım çalışması, her biri farklı hedeflere ve insanlar tarafından yapılan değerlendirme metriklerine sahip farklı ekipler. Bu modellerle alakalı bir dizi farklı kategoriye göre değerlendirildi. etik ve güvenlik şunları kapsar:

  • Metin-Metin İçerik Güvenliği: İstemlerin güvenliği kapsayan gerçek kişiler tarafından değerlendirilmesi çocuğun cinsel istismarı ve çocuk istismarı, taciz ve şiddet dahil politikalar vahşet ve nefret söylemi.
  • Text-to-Text Resmî Zararlar: İlgili akademisyenlerle karşılaştırma yapın WinoBias ve Barbekü Veri Kümesi gibi veri kümeleriyle ilişkilendirilebilir.
  • Hatırlama: Aşağıdakiler dahil olmak üzere eğitim verilerinin ezberlenmesinin otomatik olarak değerlendirilmesi kimliği tanımlayabilecek bilgilerin açığa çıkma riski.
  • Büyük ölçekte zarar: "Tehlikeli olanaklar" için testler kimyasal maddeler, biyolojik, radyolojik ve nükleer (CBRN) riskleri.

Değerlendirme Sonuçları

Etik ve güvenlik değerlendirmelerinin sonuçları kabul edilebilir eşikler dahilindedir Alt yayıncı gibi kategorilerle ilgili dahili politikaları karşılamak için güvenlik, içerik güvenliği, temsili zararlar, ezberleme, büyük ölçekli zararlar. Sağlam dahili değerlendirmelerin yanı sıra, iyi bilinen güvenlik önlemlerinin sonuçları Barbekü, BOLD, Winogender, Winobias, RealToxicity ve TruthfulQA gibi karşılaştırmalar burada gösterilir.

Gemma 1.0

Karşılaştırma Metrik Gemma 1.0 BT 2B Gemma 1.0 BT 7B
RealToxicity ortalama 6,86 7,90
BOLD 45,57 49,08
CrowS-Çiftleri top-1 45,82 51,33
Barbekü Ambig 1 çekim, ilk 1 62,58 92,54
Barbekü Belirsizliği top-1 54,62 71,99
Winogender top-1 51,25 54,17
TruthfulQA 44,84 31,81
Winobias 1_2 56,12 59,09
Winobias 2_2 91,10 92,23
Toxigen 29,77 39,59

Gemma 1.1

Karşılaştırma Metrik Gemma 1.1 BT 2B Gemma 1.1 BT 7B
RealToxicity ortalama 7,03 8,04
BOLD 47,76
CrowS-Çiftleri top-1 45,89 49,67
Barbekü Ambig 1 çekim, ilk 1 58,97 86,06
Barbekü Belirsizliği top-1 53,90 85,08
Winogender top-1 50,14 57,64
TruthfulQA 44,24 45,34
Winobias 1_2 55,93 59,22
Winobias 2_2 89,46 89,2
Toxigen 29,64 38,75

Kullanım ve Sınırlamalar

Bu modellerde kullanıcıların bilmesi gereken belirli sınırlamalar vardır.

Amaçlanan Kullanım

Açık, Büyük Dil Modelleri (LLM'ler), Google Etiket Yöneticisi'nde çok çeşitli farklı sektör ve alanlarda faaliyet gösterir. Aşağıdaki olası kullanımlar listesi size yönetmektir. Bu listenin amacı bağlamsal bilgiler sağlamaktır model oluşturanların modelin bir parçası olarak değerlendirdiği olası kullanım alanları hakkında ve geliştirmeyi öğreteceğim.

  • İçerik Üretme ve İletişim
    • Metin Oluşturma: Bu modeller, reklam öğesi metin biçimleri oluşturmak için kullanılabilir şiir, senaryo, kod, pazarlama metni ve e-posta taslakları gibi
    • Chatbot'lar ve etkileşimli yapay zeka: Müşteriler için sohbet arayüzlerini destekleyin sanal asistanlar ya da etkileşimli uygulamalar kullanılabilir.
    • Metin Özetleme: Bir metin topluluğunun, araştırmaların kısa ve öz özetlerini oluşturun veya raporlar.
  • Araştırma ve Eğitim
    • Doğal dil işleme (NLP) araştırması: Bu modeller araştırmacıların NLP tekniklerini deneyebileceği, geliştirebileceği ve ve alanın gelişimine katkıda bulunmaktır.
    • Dil Öğrenme Araçları: Etkileşimli dil öğrenme deneyimlerini destekler. dil bilgisi düzeltmeye yardımcı olma veya yazma alıştırması yapma.
    • Bilgi Keşfi: Araştırmacıların büyük metin yapılarını keşfetmelerine yardımcı olma özet oluşturarak veya belirli konularla ilgili soruları yanıtlayarak

Sınırlamalar

  • Eğitim Verileri
    • Eğitim verilerinin kalitesi ve çeşitliliği, en iyi uygulamaları paylaşacağız. Eğitim verilerindeki sapmalar veya boşluklar, modelin yanıtlarındaki sınırlamalar.
    • Eğitim veri kümesinin kapsamı, modelin gösterebileceği konu alanlarını belirler ele alacağız.
  • Bağlam ve Görevin Karmaşıklığı
    • LLM'ler, net istemler ve ifadelerle çerçevelenebilecek görevlerde daha başarılıdır. bakın. Açık uçlu veya son derece karmaşık görevler zorlayıcı olabilir.
    • Bir modelin performansı, sağlanan bağlam miktarından etkilenebilir (bağlamın uzun olması genellikle belirli bir noktaya kadar daha iyi sonuçlar elde edilmesini sağlar).
  • Dil Belirsizliği ve Nüansı
    • Doğal dil, yapısı gereği karmaşıktır. LLM'ler karmaşık konuları kavramada nüanslar, alay veya mecazi dil.
  • Gerçeklik
    • LLM'ler, geliştiricilerin deneyimlerinden öğrendikleri bilgilere dayalı olarak yanıtlar oluşturur. ancak bunlar bilgi tabanı değildir. Örneğin, ya da güncelliğini yitirmiş, gerçeğe dayalı ifadeler.
  • Sağduyu
    • LLM'ler, dildeki istatistiksel kalıplara dayanır. Yetenekleri olmayabilir sağduyulu akıl yürütmeyi öğreneceksiniz.

Etik Değerlendirmeler ve Riskler

Büyük dil modellerinin (LLM) geliştirilmesi bazı etik kaygıları da beraberinde getirmektedir. Açık bir model oluştururken aşağıdakileri dikkatlice inceledik:

  • Önyargı ve Adalet
    • Büyük ölçekli, gerçek metin verileriyle eğitilen LLM'ler sosyo-kültürel öğeleri yansıtabilir önyargıları pekiştirir. Bu modellerde inceleme, verilerin ön işleme tabi tutulması ve son değerlendirmelerin bu kartta bildirildi.
  • Yanlış Bilgilendirme ve Kötüye Kullanım
    • LLM'ler yanlış, yanıltıcı veya zararlı metinler oluşturmak için kötüye kullanılabilir.
    • Modelin sorumlu kullanımına ilişkin yönergeler verilmiştir. Daha fazla bilgi için Sorumlu Üretken Yapay Zeka Araç Seti.
  • Şeffaflık ve Sorumluluk:
    • Bu model kartında modellerle ilgili ayrıntıları mimari, üzerine konuşacağız.
    • Sorumlu bir şekilde geliştirilmiş açık bir model, dünyanın dört bir yanındaki LLM teknolojisini geliştiricilerin ve araştırmacıların erişebileceği hale getirerek yenilikler gözlemlediğimiz bir grup taktik bulunur.

Belirlenen riskler ve azaltmalar:

  • Yanlılıkların sürekliliği: Sürekli izleme yapılması önerilir (değerlendirme metrikleri, gerçek kişiler tarafından yapılan incelemeler) ve önyargısızlığın keşfi ince ayar yapma ve diğer kullanım alanlarında geliştirme yapmalarına yardımcı olur.
  • Zararlı içerik üretimi: İçerik güvenliğiyle ilgili mekanizmalar ve kurallar olmazsa olmazdır. Geliştiricilerin dikkatli olması ve Belirli ürün politikalarına dayanan uygun içerik güvenliği önlemleri kullanım alanlarından bahsedeceğiz.
  • Kötü amaçlarla kötüye kullanım: Teknik sınırlamalar ve geliştirici ve son kullanıcı eğitimi, LLM'lerin kötü amaçlı uygulamalarını azaltmaya yardımcı olabilir. Kullanıcıların kötüye kullanımı bildirmek için kullanabilecekleri eğitim kaynakları ve bildirim mekanizmaları sağlar. Gemma modellerinin yasaklanmış kullanımları Gemma Yasaklanan Kullanım Politikası.
  • Gizlilik ihlalleri: Modeller, kimliği tanımlayabilecek bilgilerin (PII) kaldırılması için filtrelenmiş veriler üzerine eğitilmiştir. (kimliği tanımlayabilecek bilgiler) Geliştiricilerin gizlilikle ilgili yönetmelikleri uygulamalısınız.

Avantajları

Bu model ailesi, piyasaya sürüldüğünde yüksek performans sunar. için sıfırdan tasarlanmış büyük dil modeli uygulamaları Benzer boyuttaki modellere kıyasla yapay zekayı geliştirme.

Bu modeller, bu belgede açıklanan karşılaştırma değerlendirme metriklerini kullanarak benzer boyutlardaki diğer açık modellerden daha iyi performans sağladığını göstermiştir. sağlayabilir.