Форматирование Gemma и системные инструкции

Модели Gemma, настроенные на инструкции (IT), обучаются с помощью специального средства форматирования , которое аннотирует все примеры настройки инструкций дополнительной информацией как во время обучения, так и во время вывода. Форматер имеет две цели:

  1. Указание ролей в разговоре, например роли системы , пользователя или помощника .
  2. Обозначение поворотов в разговоре, особенно в многооборотном разговоре.

Ниже мы указываем управляющие токены, используемые Gemma, и варианты их использования. Обратите внимание, что токены управления зарезервированы и специфичны для нашего токенизатора.

  • Токен для обозначения очереди пользователя: user
  • Жетон, обозначающий поворот модели: model
  • Токен, обозначающий начало хода диалога: <start_of_turn>
  • Токен, обозначающий окончание хода диалога: <end_of_turn>

Вот пример диалога:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

Токен "<end_of_turn>\n" является разделителем поворотов, а префикс приглашения — "<start_of_turn>model\n" . Это означает, что если вы хотите задать модели вопрос типа «Что такое правило Крамера?», вам следует вместо этого передать модели следующее:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

Обратите внимание: если вы хотите точно настроить предварительно обученные модели Gemma с помощью собственных данных, вы можете использовать любую такую ​​схему для управляющих токенов, если она согласуется между вашими вариантами использования обучения и вывода.

Системные инструкции

Модели Gemma, настроенные с помощью инструкций, предназначены для работы только с двумя ролями: user и model . Таким образом, system роль или системный ход не поддерживаются.

Вместо использования отдельной системной роли предоставляйте инструкции на уровне системы непосредственно в первоначальном приглашении пользователя. Возможности следования инструкциям модели позволяют Gemma эффективно интерпретировать инструкции. Например:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>