Nënklasa të njohura direkte |
Delegoni opsionet.
Klasat e mbivendosura
një numër | GpuDelegateFactory.Options.GpuBackend | Cilin backend GPU për të zgjedhur. |
Konstante
int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Delegate do të përdoret vetëm një herë, prandaj duhet të merret parasysh koha e bootstrap/init. |
int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Preferoni maksimizimin e xhiros. |
Ndërtuesit Publikë
Opsionet () |
Metodat publike
logjike | |
GpuDelegateFactory.Options.GpuBackend | |
int | |
Vargu | |
Vargu | |
logjike | |
GpuDelegateFactory.Opsionet | |
GpuDelegateFactory.Opsionet | setInferencePreference (preferenca int) Vendos preferencën e konkluzionit për kompromiset e saktësisë/përpilimit/kohës së ekzekutimit. |
GpuDelegateFactory.Opsionet | setPrecisionLossAllowed (precision BooleanLossAllowed) Vendos nëse humbja e saktësisë lejohet. |
GpuDelegateFactory.Opsionet | setQuantizedModelsAllowed (Models QuantizedAllowed Boolean) Aktivizon ekzekutimin e modeleve të kuantizuara me delegatin. |
GpuDelegateFactory.Opsionet | setSerializationParams (Serializimi i vargutDir , modeli i vargutToken ) Aktivizon serializimin tek delegati. |
Metodat e trashëguara
Konstante
int final statik publik INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Delegate do të përdoret vetëm një herë, prandaj duhet të merret parasysh koha e bootstrap/init.
int final statik publik INFERENCE_PREFERENCE_SUSTAINED_SPEED
Preferoni maksimizimin e xhiros. I njëjti delegat do të përdoret në mënyrë të përsëritur në hyrje të shumta.
Ndërtuesit Publikë
Opsionet publike ()
Metodat publike
boolean publike areQuantizedModelsAllowed ()
publike int getInferencePreference ()
boolean publik është PrecisionLossAllowed ()
publike GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend forceBackend)
Vendos prapavijën e GPU-së.
Parametrat
forceBackend |
---|
publike GpuDelegateFactory. Options setInferencePreference (int preference)
Vendos preferencën e konkluzionit për kompromiset e saktësisë/përpilimit/kohës së ekzekutimit.
Parametrat
preferencë | Një nga "INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER" (i parazgjedhur), "INFERENCE_PREFERENCE_SUSTAINED_SPEED". |
---|
publike GpuDelegateFactory.Opsionet e vendosurPrecisionLossAllowed (precision BooleanLossAllowed)
Vendos nëse humbja e saktësisë lejohet.
Parametrat
precisionLossAllowed | Kur "e vërtetë" (e parazgjedhur), GPU mund të përcaktojë sasinë e tensorëve, vlerave të zbritura, proceseve në FP16. Kur "false", llogaritjet kryhen në pikë lundruese 32-bit. |
---|
publike GpuDelegateFactory.Opsionet e vendosuraQuantizedModelsAllowed (Models quantizedBooleanAllowed)
Aktivizon ekzekutimin e modeleve të kuantizuara me delegatin.
PARALAJMËRIM: Ky është një API eksperimental dhe mund të ndryshojë.
Parametrat
modele të kuantizuara të lejuara | Kur true (e parazgjedhur), GPU mund të ekzekutojë modele të kuantizuara. |
---|
publike GpuDelegateFactory.Options setSerializationParams (Serializimi i vargutDir , modeli i vargutToken )
Aktivizon serializimin tek delegati. Shënim për serializationDir
jo-nullDir dhe modelToken
kërkohen për serializimin.
PARALAJMËRIM: Ky është një API eksperimental dhe mund të ndryshojë.
Parametrat
serializimiDir | Drejtoria për t'u përdorur për ruajtjen e të dhënave. Telefonuesi është përgjegjës për të siguruar që modeli të mos ruhet në një drejtori publike. Rekomandohet të përdorni Context.getCodeCacheDir() për të siguruar një vendndodhje private për aplikacionin në Android. |
---|---|
modelToken | Shenja që do të përdoret për të identifikuar modelin. Telefonuesi është përgjegjës për të siguruar që token është unik për grafikun e modelit dhe të dhënat. |