Modelet e akorduara me instruksione Gemma (IT) trajnohen me një formatues specifik që shënon të gjithë shembujt e akordimit të udhëzimeve me informacion shtesë, si në kohën e trajnimit ashtu edhe në kohën e përfundimit. Formatuesi ka dy qëllime:
- Tregimi i roleve në një bisedë, të tilla si rolet e sistemit , përdoruesit ose asistentit .
- Përcaktimi i kthesave në një bisedë, veçanërisht në një bisedë me shumë kthesa.
Më poshtë, ne specifikojmë shenjat e kontrollit të përdorur nga Gemma dhe rastet e përdorimit të tyre. Vini re se shenjat e kontrollit janë të rezervuara dhe specifike për tokenizuesin tonë.
- Token për të treguar një kthesë të përdoruesit:
user
- Token për të treguar një kthesë të modelit:
model
- Token për të treguar fillimin e kthesës së dialogut:
<start_of_turn>
- Token për të treguar fundin e kthesës së dialogut:
<end_of_turn>
Këtu është një shembull i dialogut:
<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>
Shenja "<end_of_turn>\n"
është ndarësi i kthesave dhe prefiksi i kërkesës është "<start_of_turn>model\n"
. Kjo do të thotë që nëse dëshironi t'i bëni modelit një pyetje si, "Çfarë është Rregulli i Cramer?", në vend të kësaj duhet ta ushqeni modelin si më poshtë:
"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"
Vini re se nëse doni të rregulloni modelet e paratrajnuara Gemma me të dhënat tuaja, mund të përdorni çdo skemë të tillë për shenjat e kontrollit, për sa kohë që është në përputhje midis rasteve të përdorimit të trajnimit dhe përfundimit.
Udhëzimet e sistemit
Modelet e akorduara me udhëzime të Gemma janë krijuar për të punuar vetëm me dy role: user
dhe model
. Prandaj, roli system
ose një kthesë e sistemit nuk mbështetet.
Në vend që të përdorni një rol të veçantë të sistemit, jepni udhëzime të nivelit të sistemit direkt brenda kërkesës fillestare të përdoruesit. Aftësitë e mëposhtme të udhëzimit të modelit lejojnë Gemma të interpretojë udhëzimet në mënyrë efektive. Për shembull:
<start_of_turn>user
Only reply like a pirate.
What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>