Известные прямые подклассы |
Варианты делегирования.
Вложенные классы
перечисление | GpuDelegateFactory.Options.GpuBackend | Какой серверный процессор GPU выбрать. |
Константы
интервал | INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER | Делегат будет использоваться только один раз, поэтому следует учитывать время загрузки/инициализации. |
интервал | INFERENCE_PREFERENCE_SUSTAINED_SPEED | Предпочитаю максимизировать пропускную способность. |
Публичные конструкторы
Параметры () |
Публичные методы
логическое значение | |
GpuDelegateFactory.Options.GpuBackend | |
интервал | |
Нить | |
Нить | |
логическое значение | |
GpuDelegateFactory.Options | setForceBackend ( GpuDelegateFactory.Options.GpuBackend ForceBackend) Устанавливает серверную часть графического процессора. |
GpuDelegateFactory.Options | setInferencePreference (целое предпочтение) Устанавливает предпочтение вывода для компромиссов между точностью/компиляцией/время выполнения. |
GpuDelegateFactory.Options | setPrecisionLossAllowed (логическое значение точностиLossAllowed) Устанавливает, разрешена ли потеря точности. |
GpuDelegateFactory.Options | setQuantizedModelsAllowed (логическое значение quantizedModelsAllowed) Позволяет запускать квантованные модели с делегатом. |
GpuDelegateFactory.Options | setSerializationParams ( String seriesizationDir, String modelToken) Включает сериализацию на делегате. |
Унаследованные методы
Константы
public static Final int INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER
Делегат будет использоваться только один раз, поэтому следует учитывать время загрузки/инициализации.
общедоступный статический окончательный int INFERENCE_PREFERENCE_SUSTAINED_SPEED
Предпочитаю максимизировать пропускную способность. Один и тот же делегат будет использоваться повторно на нескольких входах.
Публичные конструкторы
общедоступные параметры ()
Публичные методы
общедоступное логическое значение areQuantizedModelsAllowed ()
public int getInferencePreference ()
общедоступное логическое значение isPrecisionLossAllowed ()
public GpuDelegateFactory.Options setForceBackend ( GpuDelegateFactory.Options.GpuBackend ForceBackend)
Устанавливает серверную часть графического процессора.
Параметры
ForceBackend |
---|
public GpuDelegateFactory.Options setInferencePreference (предпочтение int)
Устанавливает предпочтение вывода для компромиссов между точностью/компиляцией/время выполнения.
Параметры
предпочтение | Один из `INFERENCE_PREFERENCE_FAST_SINGLE_ANSWER` (по умолчанию), `INFERENCE_PREFERENCE_SUSTAINED_SPEED`. |
---|
public GpuDelegateFactory.Options setPrecisionLossAllowed (логическое значение PrecisionLossAllowed)
Устанавливает, разрешена ли потеря точности.
Параметры
точностьПотеряРазрешена | Если установлено значение «истина» (по умолчанию), графический процессор может количественно определять тензоры, приводить значения и обрабатывать их в FP16. Если установлено значение «false», вычисления выполняются в 32-битном формате с плавающей запятой. |
---|
public GpuDelegateFactory.Options setQuantizedModelsAllowed (логическое значение quantizedModelsAllowed)
Позволяет запускать квантованные модели с делегатом.
ВНИМАНИЕ: это экспериментальный API, в который могут быть внесены изменения.
Параметры
квантованныеМоделиРазрешено | Если установлено true (по умолчанию), графический процессор может запускать квантованные модели. |
---|
public GpuDelegateFactory.Options setSerializationParams ( StringserializationDir , String modelToken)
Включает сериализацию на делегате. Обратите внимание, что для сериализации требуются ненулевые serializationDir
и modelToken
.
ВНИМАНИЕ: это экспериментальный API, в который могут быть внесены изменения.
Параметры
сериализацияDir | Каталог, который будет использоваться для хранения данных. Вызывающая сторона несет ответственность за то, чтобы модель не хранилась в общедоступном каталоге. Рекомендуется использовать Context.getCodeCacheDir() , чтобы предоставить частное расположение приложения на Android. |
---|---|
модельТокен | Токен, который будет использоваться для идентификации модели. Вызывающая сторона несет ответственность за то, чтобы токен был уникальным для графа и данных модели. |