Семейство открытых моделей Gemma включает в себя модели различных размеров, возможностей и специализированных вариантов для решения конкретных задач, что позволяет создавать собственные генеративные решения. Вот основные пути использования моделей Gemma в приложениях:
- Выберите модель и разверните её в своём приложении как есть.
- Выберите модель, настройте её для решения конкретной задачи , а затем разверните в приложении или поделитесь ею с сообществом.
Это руководство поможет вам начать работу с выбором модели, тестированием ее возможностей и, при необходимости, настройкой выбранной модели для вашего приложения.
Найдите это на Kaggle Найдите это на Hugging Face
Выберите модель
В этом разделе вы сможете ознакомиться с официальными вариантами семейства моделей Gemma и выбрать модель для своего приложения. Варианты моделей предоставляют общие возможности или специализируются на конкретных задачах и предлагаются с различными размерами параметров, поэтому вы можете выбрать модель, которая обладает необходимыми вам возможностями и соответствует вашим вычислительным требованиям.
В таблице ниже перечислены основные варианты семейства моделей Gemma и предназначенные для них платформы развертывания:
Семья Джеммы 4
Новейшее поколение устройств с поддержкой мультимодального ввода (текст, изображение, аудио).
| Размер | Вариант | Ввод ➔ Вывод | Предполагаемая платформа |
|---|---|---|---|
| E2B | Джемма 4 (основа) | Текст, изображения, аудио ➔ Текст | Мобильные устройства |
| E4B | Джемма 4 (основа) | Текст, изображения, аудио ➔ Текст | Мобильные устройства и ноутбуки |
| А4Б | Джемма 4 (основа) | Текст, изображения ➔ Текст | Настольные компьютеры и небольшие серверы |
| 31Б | Джемма 4 (основной) | Текст, изображения ➔ Текст | Крупные серверы или серверные кластеры |
Джемма 3 и 3n Семья
Базовые модели для масштабируемой обработки текста и изображений, а также варианты «3n» для расширенных многомодальных входных данных.
| Размер | Вариант | Ввод ➔ Вывод | Предполагаемая платформа |
|---|---|---|---|
| 270М | Джемма 3 (основной) | Текст ➔ Текст | Мобильные устройства и одноплатные компьютеры |
| 1Б | Джемма 3 (основной) | Текст ➔ Текст | Мобильные устройства и одноплатные компьютеры |
| E2B | Джемма 3н | Текст, изображения, аудио ➔ Текст | Мобильные устройства |
| 4Б | Джемма 3 (основной) | Текст, изображения ➔ Текст | Настольные компьютеры и небольшие серверы |
| E4B | Джемма 3н | Текст, изображения, аудио ➔ Текст | Мобильные устройства и ноутбуки |
| 12Б | Джемма 3 (основной) | Текст, изображения ➔ Текст | Высокопроизводительные настольные компьютеры и серверы |
| 27Б | Джемма 3 (основной) | Текст, изображения ➔ Текст | Крупные серверы или серверные кластеры |
Семья Джеммы 2
Включает стандартные текстовые модели и мультимодальные варианты визуально-языковой системы PaliGemma 2.
| Размер | Вариант | Ввод ➔ Вывод | Предполагаемая платформа |
|---|---|---|---|
| 2Б | Джемма 2 (основной) | Текст ➔ Текст | Мобильные устройства и ноутбуки |
| 3Б | ПалиГемма 2 | Текст, изображения ➔ Текст | Настольные компьютеры и небольшие серверы |
| 9Б | Джемма 2 (основной) | Текст ➔ Текст | Высокопроизводительные настольные компьютеры и серверы |
| 10Б | ПалиГемма 2 | Текст, изображения ➔ Текст | Высокопроизводительные настольные компьютеры и серверы |
| 27Б | Джемма 2 (основной) | Текст ➔ Текст | Крупные серверы или серверные кластеры |
| 28Б | ПалиГемма 2 | Текст, изображения ➔ Текст | Крупные серверы или серверные кластеры |
Семья Джеммы 1
Исходное поколение, включая варианты, специфичные для кодирования.
| Размер | Вариант | Ввод ➔ Вывод | Предполагаемая платформа |
|---|---|---|---|
| 2Б | Джемма (основной состав) CodeGemma | Текст ➔ Текст | Мобильные устройства и ноутбуки |
| 7Б | Джемма (основной состав) CodeGemma | Текст ➔ Текст | Настольные компьютеры и небольшие серверы |
Семейство моделей Gemma также включает в себя модели специального назначения и исследовательские модели, в том числе ShieldGemma , DataGemma , Gemma Scope и Gemma-APS .
Тестовые модели
Вы можете протестировать модели Gemma, настроив среду разработки с загруженной моделью и соответствующим программным обеспечением. Затем вы можете задать модели параметры и оценить её ответы. Используйте один из следующих блокнотов Python с предпочитаемой вами средой машинного обучения, чтобы настроить среду тестирования и задать параметры модели Gemma:
- Вывод результатов с помощью Keras
- Вывод результатов с помощью PyTorch
- Вывод результатов с помощью библиотеки Gemma
Настройте модели
Вы можете изменить поведение моделей Gemma, выполнив их настройку. Для настройки модели требуется набор входных данных и ожидаемых ответов достаточного размера и вариативности, чтобы направлять поведение модели. Кроме того, для завершения процесса настройки требуется значительно больше вычислительных ресурсов и памяти по сравнению с запуском модели Gemma для генерации текста. Используйте один из следующих блокнотов Python для настройки среды разработки и настройки модели Gemma:
- Настройте Gemma с помощью Keras и LoRA.
- Настраивайте более крупные модели Gemma с помощью распределенного обучения.
Следующие шаги
Ознакомьтесь с этими руководствами по созданию большего количества решений с помощью Gemma: