LlmInference.LlmInferenceOptions

Clase abstracta estática pública LlmInference.LlmInferenceOptions

Opciones para configurar un LlmInference.

Categorías anidadas

clase LlmInference.LlmInferenceOptions.Builder Compilador para LlmInference.LlmInferenceOptions

Constructores públicos

Métodos públicos

estático LlmInference.LlmInferenceOptions.Builder
builder()
Crea una instancia de un compilador LlmInferenceOptions nuevo.
abstracto Opcional<ErrorListener>
errorListener()
El objeto de escucha de errores que se usa para la API de ERROR(/LlmInference#generateAsync).
abstracto Opcional<String>
loraPath()
Es la ruta de acceso absoluta al paquete de recursos del modelo de LoRA almacenado de forma local en el dispositivo.
resumen int
maxTokens()
La longitud total de la caché kv.
resumen String
modelPath()
La ruta de acceso que apunta al archivo de modelo de tflite.
resumen int
randomSeed()
Valor inicial aleatorio para los tokens de muestreo.
abstracto Opcional<ProgressListener<String>>
resultListener()
El objeto de escucha de resultados que se usará para la API de ERROR(/LlmInference#generateAsync).
abstract float
temperatura()
Aleatorización cuando se decodifica el siguiente token.
resumen int
topK()
El Top K de tokens de los que se muestrear para cada paso de decodificación.

Métodos heredados

Constructores públicos

public LlmInferenceOptions ()

Métodos públicos

público estático LlmInference.LlmInferenceOptions.Builder builder ()

Crea una instancia de un compilador LlmInferenceOptions nuevo.

resumen público Opcional<ErrorListener> errorListener ()

El objeto de escucha de errores que se usa para la API de ERROR(/LlmInference#generateAsync).

public resumen Opcional<String> loraPath ()

Es la ruta de acceso absoluta al paquete de recursos del modelo de LoRA almacenado de forma local en el dispositivo. Solo es compatible con los modelos de GPU.

public resumen int maxTokens ()

La longitud total de la caché kv. En otras palabras, esta es la cantidad total de tokens de entrada y salida que el modelo debe controlar.

public resumen String modelPath ()

La ruta de acceso que apunta al archivo de modelo de tflite.

public resumen int randomSeed ()

Valor inicial aleatorio para los tokens de muestreo.

público abstracto Opcional<ProgressListener<String>> resultListener ()

El objeto de escucha de resultados que se usará para la API de ERROR(/LlmInference#generateAsync).

public resumen float temperatura ()

Aleatorización cuando se decodifica el siguiente token. Un valor de 0.0f significa una decodificación codiciosa.

public abstract int topK ()

El Top K de tokens de los que se muestrear para cada paso de decodificación. Un valor de 1 significa decodificación voraz.