Formatimi Gemma dhe udhëzimet e sistemit

Modelet e akorduara me instruksione Gemma (IT) trajnohen me një formatues specifik që shënon të gjithë shembujt e akordimit të udhëzimeve me informacion shtesë, si në kohën e trajnimit ashtu edhe në kohën e përfundimit. Formatuesi ka dy qëllime:

  1. Tregimi i roleve në një bisedë, të tilla si rolet e sistemit , përdoruesit ose asistentit .
  2. Përcaktimi i kthesave në një bisedë, veçanërisht në një bisedë me shumë kthesa.

Më poshtë, ne specifikojmë shenjat e kontrollit të përdorur nga Gemma dhe rastet e përdorimit të tyre. Vini re se shenjat e kontrollit janë të rezervuara dhe specifike për tokenizuesin tonë.

  • Token për të treguar një kthesë të përdoruesit: user
  • Token për të treguar një kthesë të modelit: model
  • Token për të treguar fillimin e kthesës së dialogut: <start_of_turn>
  • Token për të treguar fundin e kthesës së dialogut: <end_of_turn>

Këtu është një shembull i dialogut:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

Shenja "<end_of_turn>\n" është ndarësi i kthesave dhe prefiksi i kërkesës është "<start_of_turn>model\n" . Kjo do të thotë që nëse dëshironi t'i bëni modelit një pyetje si, "Çfarë është Rregulli i Cramer?", në vend të kësaj duhet ta ushqeni modelin si më poshtë:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

Vini re se nëse doni të rregulloni modelet e paratrajnuara Gemma me të dhënat tuaja, mund të përdorni çdo skemë të tillë për shenjat e kontrollit, për sa kohë që është në përputhje midis rasteve të përdorimit të trajnimit dhe përfundimit.

Udhëzimet e sistemit

Modelet e akorduara me udhëzime të Gemma janë krijuar për të punuar vetëm me dy role: user dhe model . Prandaj, roli system ose një kthesë e sistemit nuk mbështetet.

Në vend që të përdorni një rol të veçantë të sistemit, jepni udhëzime të nivelit të sistemit direkt brenda kërkesës fillestare të përdoruesit. Aftësitë e mëposhtme të udhëzimit të modelit lejojnë Gemma të interpretojë udhëzimet në mënyrë efektive. Për shembull:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>