Paketa litert-lm-builder ofron mjete Python dhe Ndërfaqe të Linjës së Komandës (CLI) për të ndërtuar, inspektuar dhe çpaketuar skedarët kontejnerë LiteRT-LM ( .litertlm ) .
Një skedar .litertlm është një kontejner i vetëm i unifikuar që paketon modelet tuaja TFLite, skedarët tokenizer, peshat e jashtme dhe meta të dhënat e modelit të shoqëruara në mënyrë që ato të mund të shpërndahen dhe ngarkohen nga koha e ekzekutimit LiteRT-LM.
Instalimi
Instaloni paketën litert-lm-builder nga PyPI.
Metoda 1: uvx (Rekomandohet për ekzekutim të shpejtë)
Ekzekutoni menjëherë CLI-të pa një instalim të përhershëm. Kërkon uv .
uvx litert-lm-builder --help
uvx litert-lm-peek --help
Metoda 2: pip
Instalimi standard brenda një mjedisi virtual:
python3 -m venv .venv
source .venv/bin/activate
pip install --upgrade litert-lm-builder
Ndërtoni një skedar .litertlm : litert-lm-builder
Përdorni CLI-në litert-lm-builder për të paketuar komponentët e modelit tuaj. Mund ta bëni këtë duke përdorur një skedar konfigurimi ose duke lidhur zinxhir argumentet e rreshtit të komandës.
Përdorimi
Metodat e mëposhtme mund të përdoren për të përgatitur skedarin .litertlm duke përdorur ndërtuesin.
Metoda 1: Ndërtoni duke përdorur Konfigurimin TOML (Rekomandohet)
Specifikoni të gjithë komponentët, shtigjet dhe metadatat në një skedar konfigurimi TOML, pastaj ekzekutoni ndërtuesin:
litert-lm-builder toml --path config.toml output --path model.litertlm
Shembull config.toml :
[system_metadata]
entries = [
{ key = "author", value_type = "String", value = "Authors" }
]
[[section]]
section_type = "LlmMetadata"
data_path = "path/to/llm_metadata.pb"
[[section]]
section_type = "SP_Tokenizer"
data_path = "path/to/sp.model"
[[section]]
section_type = "TFLiteModel"
model_type = "PREFILL_DECODE"
data_path = "path/to/model.tflite"
additional_metadata = [
{ key = "model_version", value_type = "String", value = "1.0.1" }
]
Metoda 2: Ndërtoni duke përdorur Argumentet e Rreshtit të Komandës
Ju mund ta ndërtoni kontejnerin në mënyrë dinamike duke i lidhur nënkomandat në terminalin tuaj. Renditja e nënkomandave përcakton renditjen e seksioneve në skedarin e gjeneruar.
litert-lm-builder \
system_metadata --str author "Authors" \
llm_metadata --path path/to/llm_metadata.pb \
sp_tokenizer --path path/to/sp.model \
tflite_model --path path/to/model.tflite --model_type prefill_decode --str_metadata model_version "1.0.1" \
output --path model.litertlm
Referenca e opsioneve CLI
CLI litert-lm-builder mbështet nënkomandat e mëposhtme:
-
output(E detyrueshme): Specifikon shtegun e daljes.-
--path PATH: Shtegu për të ruajtur skedarin e ndërtuar.litertlm.
-
-
toml: Ngarko konfigurimin nga një skedar TOML.-
--path PATH: Shtegu për në skedarin.toml.
-
-
system_metadata: Shto meta të dhëna globale të sistemit.-
--str KEY VALUE: Shto një çift çelës-vlerë vargu (mund të specifikohet disa herë). -
--int KEY VALUE: Shto një çift çelës-vlerë numër të plotë (mund të specifikohet disa herë). - Shënim : Ndërtuesi gjeneron dhe shton automatikisht një
uuiddhecreation_timestampunike (në formatin UTC ISO 8601) në metadatat e sistemit. Mos i specifikoni këto çelësa manualisht. Këto fusha përdoren nga koha e ekzekutimit për të identifikuar ndërtimin e modelit në mënyrë unike dhe për të menaxhuar pavlefshmërinë e memories së përpiluar.
-
-
llm_metadata: Shto konfigurim specifik për LLM.-
--path PATH: Shtegu për te meta të dhënat LLM (tekst ose proto binar).
-
-
tflite_model: Shtoni një model TFLite.-
--path PATH: Shtegu për në skedarin.tflite. -
--model_type TYPE: Një nga:embedder,prefill_decode(që përfaqëson si prefill ashtu edhe decode),prefill,decode. -
--backend_constraint BACKEND: (Opsionale) Kufizim i Backend-it (p.sh.,gpu,cpu,npu). -
--prefer_activation_type TYPE: (Opsional) Lloji i preferuar i aktivizimit (fp16,fp32,fp32_fp16). -
--str_metadata KEY VALUE: (Opsionale) Metadata vargu për këtë seksion modeli.
-
-
sp_tokenizer: Shto një tokenizues SentencePiece.-
--path PATH: Shtegu për në skedarin.model. -
--str_metadata KEY VALUE: (Opsionale) Meta të dhëna vargu.
-
-
hf_tokenizer: Shto një tokenizues të fytyrës përqafuese.-
--path PATH: Shtegu për në skedarintokenizer.json. -
--str_metadata KEY VALUE: (Opsionale) Meta të dhëna vargu.
-
Inspektoni dhe çpaketoni një skedar .litertlm : litert-lm-peek
Përdorni CLI-në litert-lm-peek për të inspektuar një kontejner .litertlm ose për të çpaketuar komponentët e tij të integruar. Ekzekutimi i saj shfaq strukturën e plotë të kontejnerit, të gjitha seksionet e paketuara dhe meta të dhënat e gjeneruara automatikisht të sistemit (siç janë uuid dhe creation_timestamp ).
Përdorimi
litert-lm-peek --litertlm_file model.litertlm [options]
Referenca e opsioneve CLI
-
--litertlm_file PATH(E detyrueshme): Shtegu për në skedarin.litertlmqë duhet inspektuar. -
--dump_files_dir PATH(Opsionale): Drejtoria ku duhet të nxirren/çpaketohen të gjithë skedarët e paketuar (modelet, tokenizuesit, peshat, meta të dhënat). Nëse nuk jepet, mjeti do të shtypë vetëm meta të dhënat dhe strukturën e seksionit në tastierë pa nxjerrë skedarë.