Rregullimi i imët i modelit Gemma, Rregullimi i imët i modelit Gemma, Rregullimi i imët i modelit Gemma, Rregullimi i imët i modelit Gemma

Rregullimi i imët i një modeli të inteligjencës artificiale gjeneruese (IA) siç është Gemma modifikon sjelljen e modelit. Zakonisht, ju e rregulloni Gemma-n me qëllim përmirësimin e performancës së saj në një detyrë ose fushë specifike, ose për të përmbushur më mirë një rol, siç është shërbimi ndaj klientit. Modelet Gemma publikohen me pesha të hapura, që do të thotë se ju mund t'i modifikoni ato pesha, të cilat më pas ndryshojnë sjelljen e modelit. Hapat e përgjithshëm për rregullimin e imët të një modeli Gemma janë si më poshtë:

Zgjidhni një kornizë

Modelet Gemma janë të pajtueshme me një sërë kornizash akordimi të inteligjencës artificiale. Çdo kornizë ofron avantazhe të ndryshme dhe zakonisht kufizohet në një format specifik modeli. Ja disa udhëzues për akordimin e modeleve Gemma me korniza të ndryshme:

Sigurohuni që formati i modelit të implementimit që synoni të bëni, siç është formati Keras, Safetensors ose GGUF, mbështetet si rezultat nga kuadri juaj i zgjedhur.

Mbledh të dhëna

Akordimi i modelit kërkon të dhëna. Të dhënat e akordimit zakonisht përbëhen nga çifte të dhënash hyrëse me përgjigjen e pritur. Ka shumë grupe të dhënash publike të disponueshme në internet për trajnim mbi detyra ose rezultate të ndryshme. Për shembull, nëse dëshironi të trajnoni një model Gemma për të përkthyer përshkrimet e pjesëve të makinave në numra pjesësh, grupi juaj i të dhënave mund të përfshijë sa vijon:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

Nëse dëshironi që një model Gemma të kryejë një grup specifik detyrash ose rolesh, zakonisht duhet të përpiloni një grup të dhënash që demonstron variacione të shumëfishta të asaj detyre. Sasia e të dhënave që ju nevojiten për të akorduar një model varet nga qëllimet tuaja, veçanërisht nga sa ndryshim sjelljeje dëshironi nga modeli dhe sa mirë dëshironi që modeli të performojë bazuar në detyrën që duhet të kryhet dhe nivelin e variacionit në të dhënat hyrëse.

Në përgjithësi, duhet të filloni me një grup të vogël të dhënash për akordimin e detyrave tuaja, të rregulloni parametrat e trajnimit dhe të shtoni të dhëna derisa të arrini performancën e detyrës që plotëson nevojat tuaja. Disa nga aplikacionet tona shembull tregojnë se mund të ndikoni në sjelljen e një modeli Gemma me vetëm 20 çifte të shpejta dhe përgjigjesh. Për më shumë detaje, shihni Ndërtoni një asistent të inteligjencës artificiale të email-it për biznesin me Gemma dhe Detyrat në gjuhët e folura me Gemma .

Akordoni dhe testoni modelin

Pasi të keni një kornizë akordimi dhe të dhëna akordimi në vend, mund të filloni procesin e akordimit të modelit Gemma. Kur kryeni akordimin, keni disa opsione se si e akordoni, të cilat ndikojnë në burimet që ju nevojiten për ta përfunduar atë. Gjithashtu duhet të keni një plan testimi për modelin tuaj të akorduar për të vlerësuar nëse po funksionon ashtu siç dëshironi pas akordimit.

Akordim me efikasitet të parametrave

Kur akordoni imët një model me pesha të hapura si Gemma, keni mundësinë të akordoni të gjithë parametrat e modelit ose të përdorni një teknikë akordimi efikas të parametrave që kërkon më pak burime, e cila përditëson një nëngrup të tyre. Një qasje akordimi i plotë do të thotë që, ndërsa aplikoni të dhënat tuaja të akordimit, llogaritni pesha të reja për të gjithë parametrat e modelit. Kjo qasje është intensive në llogaritje dhe memorie, pasi po kryeni këto llogaritje për miliarda parametra. Përdorimi i qasjeve të akordimit që kërkojnë më pak burime, i quajtur akordim i imët efikas i parametrave (PEFT) , duke përfshirë teknika si akordimi Low Rank Adapter (LoRA), mund të prodhojë rezultate të ngjashme me më pak burime llogaritëse. Për detaje se si të kryeni akordimin me më pak burime duke përdorur LoRA, shihni Akordim i imët i modeleve Gemma në Keras duke përdorur LoRA dhe Akordim i imët i modeleve Gemma në Hugging Face .

Testimi i modeleve të akorduara

Pasi të keni akorduar një model për një detyrë specifike, duhet të testoni performancën e tij kundrejt grupit të detyrave që dëshironi që ai të kryejë. Duhet ta testoni modelin tuaj me detyra ose kërkesa për të cilat nuk është trajnuar posaçërisht. Mënyra se si e testoni modelin tuaj të akorduar varet nga detyra që dëshironi që ai të kryejë dhe nga sa afër i menaxhoni hyrjet dhe daljet për modelin. Një mënyrë e zakonshme për të menaxhuar testimin gjenerues të modelit është të përdorni raste suksesi, dështimi dhe raste kufitare:

  • Testet e suksesit : Kërkesat që modeli i akorduar të jetë gjithmonë në gjendje të funksionojë me sukses.
  • Testet e dështimit : Kërkesat që modeli i akorduar të mos jetë gjithmonë në gjendje të kryejë punën, ose të refuzojë në mënyrë të qartë të kryejë punën, nëse kërkohet.
  • Testet kufitare : Kërkesa që modeli i akorduar duhet të jetë në gjendje të kryejë, nëse ato bien brenda një kufiri të përcaktuar, ose një grupi kufijsh, të sjelljes së pranueshme të daljes.

Kur testoni dështimin ose kushtet kufitare për aplikacionin tuaj të IA-së gjeneruese, duhet të aplikoni gjithashtu qasje, teknika dhe mjete të sigurisë së IA-së gjeneruese, siç përshkruhet në Toolkit-in e IA-së Gjeneruese të Përgjegjshme .

Vendos modelin

Pasi të keni përfunduar me sukses akordimin dhe testimin, është koha për të vendosur modelin tuaj në zbatim. Zakonisht mund t'i referoheni dokumentacionit për kornizën tuaj të zgjedhur për mënyrën e vendosjes së një modeli të akorduar.

Nëse po vendosni një model me pesha të akorduara nga LoRA, vini re se me këtë teknikë zakonisht vendosni si modelin origjinal ashtu edhe peshat e tij me peshat LoRA si një shtresë shtesë llogaritëse për modelin.