Bekannte direkte Unterklassen |
Optionen delegieren
Verschachtelte Klassen
enum | GpuDelegateFactory.Options.GpuBackend | GPU-Backend, das ausgewählt werden soll. |
Konstanten
int | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden. |
int | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Bevorzugen Sie, den Durchsatz zu maximieren. |
Public Constructors
Options()
|
Public Methods
boolean | |
GpuDelegateFactory.Options.GpuBackend | |
int | |
String | |
String | |
boolean | |
GpuDelegateFactory.Options |
setForceBackend(GpuDelegateFactory.Options.GpuBackend erzwingen Backend)
Legt das GPU-Back-End fest.
|
GpuDelegateFactory.Options |
setInferencePreference(int-Präferenz)
Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
|
GpuDelegateFactory.Options |
setPrecisionLossAllowed(boolesche PräzisionLossAllowed)
Legt fest, ob ein Genauigkeitsverlust zulässig ist.
|
GpuDelegateFactory.Options |
setQuantizedModelsAllowed(boolesch, quantizedModelsAllowed)
Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
|
GpuDelegateFactory.Options |
setSerializationParams(String serializationDir, String modelToken)
Aktiviert die Serialisierung im Delegaten.
|
Übernommene Methoden
Konstanten
public static final Ganzzahl INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.
public static final Ganzzahl INFERENCE_PREFERENCE_SUSTAINED_SPEED
Bevorzugen Sie, den Durchsatz zu maximieren. Derselbe Delegate wird bei mehreren Eingaben wiederholt verwendet.
Public Constructors
public Optionen ()
Public Methods
public boolesch areQuantizedModelsAllowed ()
public int getInferencePreference ()
public boolesch isPrecisionLossAllowed ()
public GpuDelegateFactory.Options setForceBackend (GpuDelegateFactory.Options.GpuBackend forceBackend)
Legt das GPU-Back-End fest.
Parameter
forceBackend |
---|
public GpuDelegateFactory.Options setInferencePreference (int-Präferenz)
Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
Parameter
Einstellung | Eine von „INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER“ (Standard), „INFERENCE_PREFERENCE_SUSTAINED_SPEED“. |
---|
public GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)
Legt fest, ob ein Genauigkeitsverlust zulässig ist.
Parameter
precisionLossAllowed | Wenn „true“ (Standard) festgelegt ist, kann die GPU Tensoren, herabgestufte Werte und die Verarbeitung in FP16 quantifizieren. Bei „false“ werden Berechnungen in 32-Bit-Gleitkommazahlen ausgeführt. |
---|
public GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)
Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.
Parameter
quantizedModelsAllowed | Wenn true (Standardeinstellung) ist, kann die GPU quantisierte Modelle ausführen.
|
---|
public GpuDelegateFactory.Options setSerializationParams (String serializationDir, String modelToken)
Aktiviert die Serialisierung im Delegaten. Beachten Sie, dass serializationDir
und modelToken
, die nicht null sind, für die Serialisierung erforderlich sind.
WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.
Parameter
serializationDir | Das Verzeichnis, das zum Speichern von Daten verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Modell nicht in einem öffentlichen Verzeichnis gespeichert wird. Es empfiehlt sich, unter Android mit Context.getCodeCacheDir() einen privaten Standort für die App anzugeben. |
---|---|
modelToken | Das Token, das zur Identifizierung des Modells verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Token für die Modellgrafik und die Modelldaten eindeutig ist. |