Джемма открытые модели

Семейство легких современных открытых моделей, созданных на основе тех же исследований и технологий, которые использовались при создании моделей Gemini.

Ответственный за значок дизайна

Ответственный по дизайну

Эти модели, включающие комплексные меры безопасности, помогают обеспечить ответственные и надежные решения в области искусственного интеллекта посредством тщательно подобранных наборов данных и тщательной настройки.

Значок непревзойденной производительности

Непревзойденная производительность при таком размере

Модели Gemma достигают исключительных результатов в тестах размеров 2B, 7B, 9B и 27B, превосходя даже некоторые более крупные открытые модели.

Гибкая структура

Гибкое развертывание

Беспрепятственное развертывание на мобильных устройствах, в Интернете и в облаке с помощью Keras, JAX, MediaPipe, PyTorch, Hugging Face и других.

Попробуй Джемму 2

Gemma 2, переработанная для обеспечения высочайшей производительности и непревзойденной эффективности, оптимизируется для молниеносно быстрого вывода на разнообразном оборудовании.

5 выстрелов

ММЛУ

Тест MMLU — это тест, который измеряет широту знаний и способность решать проблемы, приобретенные большими языковыми моделями во время предварительного обучения.

25 выстрелов

АРК-С

Тест ARC-c представляет собой более специализированную подгруппу набора данных ARC-e, содержащую только вопросы, на которые неправильно ответили обычные алгоритмы (база поиска и совпадение слов).

5 выстрелов

GSM8K

Тест GSM8K проверяет способность языковой модели решать математические задачи на уровне начальной школы, которые часто требуют нескольких этапов рассуждения.

3-5 выстрелов

AGIEval

Тест AGIEval проверяет общий интеллект языковой модели, используя вопросы, полученные из реальных экзаменов, предназначенных для оценки интеллектуальных способностей человека.

3 выстрела, ЦТ

ББХ

Тест BBH (BIG-Bench Hard) фокусируется на задачах, которые выходят за рамки возможностей существующих языковых моделей, проверяя их пределы в различных областях рассуждения и понимания.

3 выстрела, F1

УРОНИТЬ

DROP — это тест на понимание прочитанного, который требует дискретного рассуждения по абзацам.

5 выстрелов

Виногранде

Тест Виногранде проверяет способность языковой модели решать неоднозначные задачи с заполнением пробелов с помощью двоичных опций, требующие обобщенных рассуждений, основанных на здравом смысле.

10 выстрелов

HellaSwag

Тест HellaSwag проверяет способность языковой модели понимать и применять здравый смысл, выбирая наиболее логичный конец истории.

4 выстрела

МАТЕМАТИКА

MATH оценивает способность языковой модели решать сложные математические словесные задачи, требующие рассуждений, многоэтапного решения задач и понимания математических концепций.

0 выстрелов

АРК-е

Тест ARC-e проверяет продвинутые навыки ответа на вопросы языковой модели с помощью естественных научных вопросов уровня начальной школы с несколькими вариантами ответов.

0 выстрелов

ПИКА

Тест PIQA проверяет способность языковой модели понимать и применять физические знания, отвечая на вопросы о повседневных физических взаимодействиях.

0 выстрелов

СИКА

Тест SIQA оценивает понимание языковой моделью социальных взаимодействий и социального здравого смысла, задавая вопросы о действиях людей и их социальных последствиях.

0 выстрелов

Булк

Тест BoolQ проверяет способность языковой модели отвечать на естественные вопросы типа «да/нет», проверяя способность модели выполнять реальные задачи вывода на естественном языке.

5 выстрелов

ВикторинаQA

Тест TriviaQA проверяет навыки понимания прочитанного с помощью тройки вопросов-ответов-доказательств.

5 выстрелов

НК

Тест NQ (Естественные вопросы) проверяет способность языковой модели находить и понимать ответы в целых статьях Википедии, моделируя реальные сценарии ответов на вопросы.

пройти@1

HumanEval

Тест HumanEval проверяет возможности языковой модели по генерации кода, оценивая, проходят ли ее решения функциональные модульные тесты для решения проблем программирования.

3 выстрела

МБПП

Тест MBPP проверяет способность языковой модели решать основные задачи программирования на Python, уделяя особое внимание фундаментальным концепциям программирования и использованию стандартной библиотеки.

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Джемма 1

2,5Б

42,3

Джемма 2

2.6Б

51,3

Мистраль

62,5

ЛЛАМА 3

66,6

Джемма 1

64,4

Джемма 2

71,3

Джемма 2

27Б

75,2

Джемма 1

2,5Б

48,5

Джемма 2

2.6Б

55,4

Мистраль

60,5

ЛЛАМА 3

59,2

Джемма 1

61,1

Джемма 2

68,4

Джемма 2

27Б

71,4

Джемма 1

2,5Б

15.1

Джемма 2

2.6Б

23,9

Мистраль

39,6

ЛЛАМА 3

45,7

Джемма 1

51,8

Джемма 2

68,6

Джемма 2

27Б

74,0

Джемма 1

2,5Б

24.2

Джемма 2

2.6Б

30,6

Мистраль

44,0

ЛЛАМА 3

45,9

Джемма 1

44,9

Джемма 2

52,8

Джемма 2

27Б

55,1

Джемма 1

2,5Б

35,2

Джемма 2

2.6Б

41,9

Мистраль

56,0

ЛЛАМА 3

61,1

Джемма 1

59,0

Джемма 2

68,2

Джемма 2

27Б

74,9

Джемма 1

2,5Б

48,5

Джемма 2

2.6Б

52,0

Мистраль

63,8

ЛЛАМА 3

58,4

Джемма 1

56,3

Джемма 2

69,4

Джемма 2

27Б

74,2

Джемма 1

2,5Б

66,8

Джемма 2

2.6Б

70,9

Мистраль

78,5

ЛЛАМА 3

76,1

Джемма 1

79,0

Джемма 2

80,6

Джемма 2

27Б

83,7

Джемма 1

2,5Б

71,7

Джемма 2

2.6Б

73,0

Мистраль

83,0

ЛЛАМА 3

82,0

Джемма 1

82,3

Джемма 2

81,9

Джемма 2

27Б

86,4

Джемма 1

2,5Б

11,8

Джемма 2

2.6Б

15,0

Мистраль

12,7

Джемма 1

24,3

Джемма 2

36,6

Джемма 2

27Б

42,3

Джемма 1

2,5Б

73,2

Джемма 2

2.6Б

80,1

Мистраль

80,5

Джемма 1

81,5

Джемма 2

88,0

Джемма 2

27Б

88,6

Джемма 1

2,5Б

77,3

Джемма 2

2.6Б

77,8

Мистраль

82,2

Джемма 1

81,2

Джемма 2

81,7

Джемма 2

27Б

83,2

Джемма 1

2,5Б

49,7

Джемма 2

2.6Б

51,9

Мистраль

47,0

Джемма 1

51,8

Джемма 2

53,4

Джемма 2

27Б

53,7

Джемма 1

2,5Б

69,4

Джемма 2

2.6Б

72,5

Мистраль

83,2

Джемма 1

83,2

Джемма 2

84,2

Джемма 2

27Б

84,8

Джемма 1

2,5Б

53,2

Джемма 2

2.6Б

59,4

Мистраль

62,5

Джемма 1

63,4

Джемма 2

76,6

Джемма 2

27Б

83,7

Джемма 1

2,5Б

12,5

Джемма 2

2.6Б

16,7

Мистраль

23.2

Джемма 1

23,0

Джемма 2

29,2

Джемма 2

27Б

34,5

Джемма 1

2,5Б

22,0

Джемма 2

2.6Б

17,7

Мистраль

26,2

Джемма 1

32,3

Джемма 2

40,2

Джемма 2

27Б

51,8

Джемма 1

2,5Б

29,2

Джемма 2

2.6Б

29,6

Мистраль

40,2

Джемма 1

44,4

Джемма 2

52,4

Джемма 2

27Б

62,6

*Это тесты для предварительно обученных моделей. Подробную информацию о производительности с другими методологиями см. в техническом отчете.

ПалиДжемма 2 Новинка

PaliGemma 2 обеспечивает легко настраиваемые возможности машинного зрения для языковых моделей Gemma 2, обеспечивая широкий спектр приложений, сочетающих понимание текста и изображений.

ДанныеГемма

DataGemma — это первые открытые модели, предназначенные для подключения LLM к обширным реальным данным, полученным из Google Data Commons.

Джемма Скоуп

Gemma Scope предлагает исследователям беспрецедентную прозрачность процессов принятия решений в наших моделях Gemma 2.

Исследуйте Джеммаверс

Обширная экосистема моделей и инструментов Gemma, созданных сообществом, готовых поддержать и вдохновить ваши инновации.

Строить

Начните строить вместе с Джеммой

Прочтите кулинарную книгу Джеммы.

Практические примеры и руководства по открытым моделям Google

Логотип «Обнимающее лицо»

Обнимающее лицо

В этом блокноте показано, как согласовать модель Gemma-2 с помощью DPO (оптимизация прямых предпочтений).

Логотип NVIDIA

NVIDIA

Точная настройка моделей Gemma с помощью NVIDIA NeMo Framework и экспорт в TensorRT-LLM для производства.

Логотип Олламы

Оллама

Выполните вывод локально на модели Gemma, используя Ollama.

Логотип Unsloth

Неленивый

Разблокируйте быструю и эффективную настройку Gemma 2 (9B) с помощью UnSloth.