Los modelos de Gemma con ajuste de instrucciones (IT) se entrenan con un formateador específico que anota todos los ejemplos de ajuste de instrucciones con información adicional, tanto en el momento del entrenamiento como en el de la inferencia. El formato tiene dos propósitos:
- Indicar roles en una conversación, como los roles de sistema, usuario o asistente
- Delinear los turnos en una conversación, especialmente en una conversación de varios turnos
A continuación, especificamos los tokens de control que usa Gemma y sus casos de uso. Ten en cuenta que los tokens de control están reservados en nuestro analizador de tokens y son específicos para él.
- Token para indicar el turno de un usuario:
user
- Token para indicar un cambio de modelo:
model
- Token para indicar el comienzo de un turno de diálogo:
<start_of_turn>
- Token para indicar el final de un turno de diálogo:
<end_of_turn>
A continuación, se muestra un ejemplo de diálogo:
<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>
El token "<end_of_turn>\n"
es el separador de turnos, y el prefijo de la instrucción es "<start_of_turn>model\n"
. Esto significa que, si quieres pedirle al modelo una pregunta como "¿Qué es la regla de Cramer?", debes ingresarlo de la siguiente manera:
"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"
Ten en cuenta que, si deseas ajustar los modelos de Gemma previamente entrenados con tus propios datos, puedes usar cualquier esquema de este tipo para los tokens de control, siempre que sea coherente entre tus casos de uso de entrenamiento y de inferencia.
Instrucciones del sistema
Los modelos ajustados por instrucciones de Gemma están diseñados para funcionar con solo dos roles: user
y model
. Por lo tanto, no se admite el rol system
ni un giro del sistema.
En lugar de usar un rol de sistema independiente, proporciona instrucciones a nivel del sistema directamente en la instrucción inicial del usuario. Las capacidades de seguimiento de instrucciones del modelo permiten que Gemma interprete las instrucciones de manera eficaz. Por ejemplo:
<start_of_turn>user
Only reply like a pirate.
What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>