Обзор модели Джемма 3

Gemma — это семейство моделей генеративного искусственного интеллекта (ИИ), и вы можете использовать их для решения самых разных задач, включая ответы на вопросы, обобщение и рассуждения. Модели Gemma оснащены открытыми весами и допускают ответственное коммерческое использование , что позволяет вам настраивать и использовать их в ваших собственных проектах и ​​приложениях.

Версия Gemma 3 включает следующие ключевые функции. Попробуйте это в AI Studio :

Вы можете скачать модели Gemma 3 с Kaggle и Hugging Face . Более подробную техническую информацию о Gemma 3 см. в карточке модели и техническом отчете . Более ранние версии основных моделей Gemma также доступны для загрузки. Дополнительную информацию см. в разделе «Предыдущие модели Gemma» .

Попробуйте Gemma 3. Получите это на Kaggle. Получите это на Hugging Face.

Мультимодальный ввод изображений и текста

Вы можете решать более сложные задачи анализа и генерации с помощью Gemma 3 благодаря ее способности обрабатывать изображения и текстовые данные. Вы можете использовать модель для интерпретации данных изображения, идентификации объектов, извлечения текстовых данных и выполнения многих других задач визуального ввода и вывода текста. Начать строительство

Контекстное окно токена 128 тыс.

Модели Gemma 3 могут обрабатывать быстрые вводы до 128 000 токенов, что в 16 раз больше контекстного окна, чем предыдущие модели Gemma. Большое количество токенов означает, что вы можете обрабатывать несколько многостраничных статей, более крупные отдельные статьи или сотни изображений в одном запросе.

Широкая языковая поддержка

Работайте на своем родном языке благодаря встроенной поддержке более 140 языков. Gemma 3 поддерживает большее количество языков по сравнению с предыдущими версиями Gemma, что позволяет вам выполнять больше визуальных и текстовых задач на языках, которые используют ваши клиенты. Начать строительство

Размеры параметров и квантование

Модели Gemma 3 доступны с 4 размерами параметров и 5 уровнями точности: от полной точности при 32 битах до минимальной точности при 4 битах. Различные размеры и точность представляют собой набор компромиссов для вашего приложения искусственного интеллекта. Модели с более высокими параметрами и количеством бит (более высокая точность), как правило, более функциональны, но их запуск обходится дороже с точки зрения циклов обработки, стоимости памяти и энергопотребления. Модели с меньшими параметрами и количеством бит (более низкая точность) имеют меньшие возможности, но могут быть достаточными для вашей задачи ИИ. В следующей таблице подробно описаны приблизительные требования к памяти графического процессора или TPU для выполнения логических выводов для каждого размера версий модели Gemma 3.

Параметры Полная 32-битная версия БФ16 (16-бит) SFP8
(8-битный)
Q4_0
(4-битный)
ИНТ4
(4-битный)
Джемма 3 1B ( только текст ) 4ГБ 1,5 ГБ 1,1 ГБ 892 МБ 861 МБ
Джемма 3 4Б 16 Гб 6,4 ГБ 4,4 ГБ 3,4 ГБ 3,2 ГБ
Джемма 3 12Б 48 ГБ 20 ГБ 12,2 ГБ 8,7 ГБ 8,2 ГБ
Джемма 3 27Б 108 ГБ 46,4 ГБ 29,1 ГБ 21 ГБ 19,9 ГБ

Таблица 1. Приблизительный объем памяти графического процессора или TPU, необходимый для загрузки моделей Gemma 3, в зависимости от количества параметров и уровня квантования (разрядности).

Потребление памяти увеличивается в зависимости от общего количества токенов, необходимых для запуска приглашения. Чем больше токенов требуется для обработки вашего приглашения, тем больше требуется памяти, которая добавляется к памяти, необходимой для загрузки модели.

Предыдущие модели Джеммы

Вы можете работать с моделями Gemma предыдущих поколений, которые также доступны в Kaggle и Hugging Face . Более подробную техническую информацию о предыдущих моделях Gemma см. на следующих страницах карточек моделей:

Готовы начать строительство? Начните работу с моделями Gemma!