Начните работу с моделями Gemma

Семейство открытых моделей Gemma включает в себя модели различных размеров, возможностей и специализированных вариантов для решения конкретных задач, что позволяет создавать собственные генеративные решения. Вот основные пути использования моделей Gemma в приложениях:

  • Выберите модель и разверните её в своём приложении как есть.
  • Выберите модель, настройте её для решения конкретной задачи , а затем разверните в приложении или поделитесь ею с сообществом.

Это руководство поможет вам начать работу с выбором модели, тестированием ее возможностей и, при необходимости, настройкой выбранной модели для вашего приложения.

Найдите это на Kaggle Найдите это на Hugging Face

Выберите модель

В этом разделе вы сможете ознакомиться с официальными вариантами семейства моделей Gemma и выбрать модель для своего приложения. Варианты моделей предоставляют общие возможности или специализируются на конкретных задачах и предлагаются с различными размерами параметров, поэтому вы можете выбрать модель, которая обладает необходимыми вам возможностями и соответствует вашим вычислительным требованиям.

В таблице ниже перечислены основные варианты семейства моделей Gemma и предназначенные для них платформы развертывания:

Семья Джеммы 4

Новейшее поколение устройств с поддержкой мультимодального ввода (текст, изображение, аудио).

Размер Вариант Ввод ➔ Вывод Предполагаемая платформа
E2B Джемма 4 (основа) Текст, изображения, аудио ➔ Текст Мобильные устройства
E4B Джемма 4 (основа) Текст, изображения, аудио ➔ Текст Мобильные устройства и ноутбуки
А4Б Джемма 4 (основа) Текст, изображения ➔ Текст Настольные компьютеры и небольшие серверы
31Б Джемма 4 (основной) Текст, изображения ➔ Текст Крупные серверы или серверные кластеры

Джемма 3 и 3n Семья

Базовые модели для масштабируемой обработки текста и изображений, а также варианты «3n» для расширенных многомодальных входных данных.

Размер Вариант Ввод ➔ Вывод Предполагаемая платформа
270М Джемма 3 (основной) Текст ➔ Текст Мобильные устройства и одноплатные компьютеры
Джемма 3 (основной) Текст ➔ Текст Мобильные устройства и одноплатные компьютеры
E2B Джемма 3н Текст, изображения, аудио ➔ Текст Мобильные устройства
Джемма 3 (основной) Текст, изображения ➔ Текст Настольные компьютеры и небольшие серверы
E4B Джемма 3н Текст, изображения, аудио ➔ Текст Мобильные устройства и ноутбуки
12Б Джемма 3 (основной) Текст, изображения ➔ Текст Высокопроизводительные настольные компьютеры и серверы
27Б Джемма 3 (основной) Текст, изображения ➔ Текст Крупные серверы или серверные кластеры

Семья Джеммы 2

Включает стандартные текстовые модели и мультимодальные варианты визуально-языковой системы PaliGemma 2.

Размер Вариант Ввод ➔ Вывод Предполагаемая платформа
Джемма 2 (основной) Текст ➔ Текст Мобильные устройства и ноутбуки
ПалиГемма 2 Текст, изображения ➔ Текст Настольные компьютеры и небольшие серверы
Джемма 2 (основной) Текст ➔ Текст Высокопроизводительные настольные компьютеры и серверы
10Б ПалиГемма 2 Текст, изображения ➔ Текст Высокопроизводительные настольные компьютеры и серверы
27Б Джемма 2 (основной) Текст ➔ Текст Крупные серверы или серверные кластеры
28Б ПалиГемма 2 Текст, изображения ➔ Текст Крупные серверы или серверные кластеры

Семья Джеммы 1

Исходное поколение, включая варианты, специфичные для кодирования.

Размер Вариант Ввод ➔ Вывод Предполагаемая платформа
Джемма (основной состав)
CodeGemma
Текст ➔ Текст Мобильные устройства и ноутбуки
Джемма (основной состав)
CodeGemma
Текст ➔ Текст Настольные компьютеры и небольшие серверы

Семейство моделей Gemma также включает в себя модели специального назначения и исследовательские модели, в том числе ShieldGemma , DataGemma , Gemma Scope и Gemma-APS .

Тестовые модели

Вы можете протестировать модели Gemma, настроив среду разработки с загруженной моделью и соответствующим программным обеспечением. Затем вы можете задать модели параметры и оценить её ответы. Используйте один из следующих блокнотов Python с предпочитаемой вами средой машинного обучения, чтобы настроить среду тестирования и задать параметры модели Gemma:

Настройте модели

Вы можете изменить поведение моделей Gemma, выполнив их настройку. Для настройки модели требуется набор входных данных и ожидаемых ответов достаточного размера и вариативности, чтобы направлять поведение модели. Кроме того, для завершения процесса настройки требуется значительно больше вычислительных ресурсов и памяти по сравнению с запуском модели Gemma для генерации текста. Используйте один из следующих блокнотов Python для настройки среды разработки и настройки модели Gemma:

Следующие шаги

Ознакомьтесь с этими руководствами по созданию большего количества решений с помощью Gemma: