коммерческое использование , что позволяет вам настраивать и использовать их в ваших собственных проектах и приложениях.
Gemma — это семейство моделей генеративного искусственного интеллекта (ИИ), и вы можете использовать их для решения самых разных задач, включая ответы на вопросы, обобщение и рассуждения. Модели Gemma оснащены открытыми весами и допускают ответственноеВерсия Gemma 3 включает следующие ключевые функции. Попробуйте это в AI Studio :
- Ввод изображений и текста . Мультимодальные возможности позволяют вводить изображения и текст для понимания и анализа визуальных данных. Начать строительство
- Контекст токена 128 КБ : входной контекст увеличен в 16 раз для анализа большего количества данных и решения более сложных задач.
- Широкая языковая поддержка : работайте на своем языке или расширьте языковые возможности вашего приложения AI за счет поддержки более 140 языков. Начать строительство
- Размеры модели, удобные для разработчиков . Выберите размер модели (1B, 4B, 12B, 27B) и уровень точности, который лучше всего подходит для вашей задачи и вычислительных ресурсов.
Вы можете скачать модели Gemma 3 с Kaggle и Hugging Face . Более подробную техническую информацию о Gemma 3 см. в карточке модели и техническом отчете . Более ранние версии основных моделей Gemma также доступны для загрузки. Дополнительную информацию см. в разделе «Предыдущие модели Gemma» .
Попробуйте Gemma 3. Получите это на Kaggle. Получите это на Hugging Face.
Мультимодальный ввод изображений и текста
Вы можете решать более сложные задачи анализа и генерации с помощью Gemma 3 благодаря ее способности обрабатывать изображения и текстовые данные. Вы можете использовать модель для интерпретации данных изображения, идентификации объектов, извлечения текстовых данных и выполнения многих других задач визуального ввода и вывода текста. Начать строительство
Контекстное окно токена 128 тыс.
Модели Gemma 3 могут обрабатывать быстрые вводы до 128 000 токенов, что в 16 раз больше контекстного окна, чем предыдущие модели Gemma. Большое количество токенов означает, что вы можете обрабатывать несколько многостраничных статей, более крупные отдельные статьи или сотни изображений в одном запросе.
Широкая языковая поддержка
Работайте на своем родном языке благодаря встроенной поддержке более 140 языков. Gemma 3 поддерживает большее количество языков по сравнению с предыдущими версиями Gemma, что позволяет вам выполнять больше визуальных и текстовых задач на языках, которые используют ваши клиенты. Начать строительство
Размеры параметров и квантование
Модели Gemma 3 доступны с 4 размерами параметров и 5 уровнями точности: от полной точности при 32 битах до минимальной точности при 4 битах. Различные размеры и точность представляют собой набор компромиссов для вашего приложения искусственного интеллекта. Модели с более высокими параметрами и количеством бит (более высокая точность), как правило, более функциональны, но их запуск обходится дороже с точки зрения циклов обработки, стоимости памяти и энергопотребления. Модели с меньшими параметрами и количеством бит (более низкая точность) имеют меньшие возможности, но могут быть достаточными для вашей задачи ИИ. В следующей таблице подробно описаны приблизительные требования к памяти графического процессора или TPU для выполнения логических выводов для каждого размера версий модели Gemma 3.
Параметры | Полная 32-битная версия | БФ16 (16-бит) | SFP8 (8-битный) | Q4_0 (4-битный) | ИНТ4 (4-битный) |
---|---|---|---|---|---|
Джемма 3 1B ( только текст ) | 4ГБ | 1,5 ГБ | 1,1 ГБ | 892 МБ | 861 МБ |
Джемма 3 4Б | 16 Гб | 6,4 ГБ | 4,4 ГБ | 3,4 ГБ | 3,2 ГБ |
Джемма 3 12Б | 48 ГБ | 20 ГБ | 12,2 ГБ | 8,7 ГБ | 8,2 ГБ |
Джемма 3 27Б | 108 ГБ | 46,4 ГБ | 29,1 ГБ | 21 ГБ | 19,9 ГБ |
Таблица 1. Приблизительный объем памяти графического процессора или TPU, необходимый для загрузки моделей Gemma 3, в зависимости от количества параметров и уровня квантования (разрядности).
Потребление памяти увеличивается в зависимости от общего количества токенов, необходимых для запуска приглашения. Чем больше токенов требуется для обработки вашего приглашения, тем больше требуется памяти, которая добавляется к памяти, необходимой для загрузки модели.
Предыдущие модели Джеммы
Вы можете работать с моделями Gemma предыдущих поколений, которые также доступны в Kaggle и Hugging Face . Более подробную техническую информацию о предыдущих моделях Gemma см. на следующих страницах карточек моделей:
- Карточка модели Джеммы 2
- Карточка модели Джеммы 1
Готовы начать строительство? Начните работу с моделями Gemma!