GpuDelegateFactory.Options

Öffentliche statische Klasse GpuDelegateFactory.Options
Bekannte direkte Unterklassen

Optionen delegieren

Verschachtelte Klassen

enum GpuDelegateFactory.Options.GpuBackend GPU-Backend, das ausgewählt werden soll. 

Konstanten

int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.
int INFERENCE_PREFERENCE_SUSTAINED_SPEED Bevorzugen Sie, den Durchsatz zu maximieren.

Public Constructors

Public Methods

boolean
GpuDelegateFactory.Options.GpuBackend
int
String
String
boolean
GpuDelegateFactory.Options
setForceBackend(GpuDelegateFactory.Options.GpuBackend erzwingen Backend)
Legt das GPU-Back-End fest.
GpuDelegateFactory.Options
setInferencePreference(int-Präferenz)
Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.
GpuDelegateFactory.Options
setPrecisionLossAllowed(boolesche PräzisionLossAllowed)
Legt fest, ob ein Genauigkeitsverlust zulässig ist.
GpuDelegateFactory.Options
setQuantizedModelsAllowed(boolesch, quantizedModelsAllowed)
Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.
GpuDelegateFactory.Options
setSerializationParams(String serializationDir, String modelToken)
Aktiviert die Serialisierung im Delegaten.

Übernommene Methoden

Konstanten

public static final Ganzzahl INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER

Delegate wird nur einmal verwendet. Daher sollte die Bootstrap-/init-Zeit berücksichtigt werden.

Konstanter Wert: 0

public static final Ganzzahl INFERENCE_PREFERENCE_SUSTAINED_SPEED

Bevorzugen Sie, den Durchsatz zu maximieren. Derselbe Delegate wird bei mehreren Eingaben wiederholt verwendet.

Konstanter Wert: 1

Public Constructors

public Optionen ()

Public Methods

public boolesch areQuantizedModelsAllowed ()

public GpuDelegateFactory.Options.GpuBackend getForceBackend ()

public int getInferencePreference ()

public String getModelToken ()

public String getSerializationDir ()

public boolesch isPrecisionLossAllowed ()

public GpuDelegateFactory.Options setForceBackend (GpuDelegateFactory.Options.GpuBackend forceBackend)

Legt das GPU-Back-End fest.

Parameter
forceBackend

public GpuDelegateFactory.Options setInferencePreference (int-Präferenz)

Legt die Inferenzpräferenz für Kompromisse bei Genauigkeit/Kompilation/Laufzeit fest.

Parameter
Einstellung Eine von „INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER“ (Standard), „INFERENCE_PREFERENCE_SUSTAINED_SPEED“.

public GpuDelegateFactory.Options setPrecisionLossAllowed (boolean precisionLossAllowed)

Legt fest, ob ein Genauigkeitsverlust zulässig ist.

Parameter
precisionLossAllowed Wenn „true“ (Standard) festgelegt ist, kann die GPU Tensoren, herabgestufte Werte und die Verarbeitung in FP16 quantifizieren. Bei „false“ werden Berechnungen in 32-Bit-Gleitkommazahlen ausgeführt.

public GpuDelegateFactory.Options setQuantizedModelsAllowed (boolean quantizedModelsAllowed)

Ermöglicht die Ausführung quantisierter Modelle mit dem Delegaten.

WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.

Parameter
quantizedModelsAllowed Wenn true (Standardeinstellung) ist, kann die GPU quantisierte Modelle ausführen.

public GpuDelegateFactory.Options setSerializationParams (String serializationDir, String modelToken)

Aktiviert die Serialisierung im Delegaten. Beachten Sie, dass serializationDir und modelToken, die nicht null sind, für die Serialisierung erforderlich sind.

WARNUNG: Dies ist eine experimentelle API, die sich noch ändern kann.

Parameter
serializationDir Das Verzeichnis, das zum Speichern von Daten verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Modell nicht in einem öffentlichen Verzeichnis gespeichert wird. Es empfiehlt sich, unter Android mit Context.getCodeCacheDir() einen privaten Standort für die App anzugeben.
modelToken Das Token, das zur Identifizierung des Modells verwendet werden soll. Der Aufrufer ist dafür verantwortlich, dass das Token für die Modellgrafik und die Modelldaten eindeutig ist.