LlmInference.LlmInferenceOptions

Clase abstracta estática pública LlmInference.LlmInferenceOptions

Opciones para configurar un LlmInference.

Categorías anidadas

clase LlmInference.LlmInferenceOptions.Builder Compilador para LlmInference.LlmInferenceOptions.

Constructores públicos

LlmInferenceOptions()

Métodos públicos

estático LlmInference.LlmInferenceOptions.Builder	builder() Crea una instancia de un compilador LlmInferenceOptions nuevo.
abstracto Opcional<ErrorListener>	errorListener() El objeto de escucha de errores que se usa para la API de `ERROR(/LlmInference#generateAsync)`.
abstracto Opcional<String>	loraPath() Es la ruta de acceso absoluta al paquete de recursos del modelo de LoRA almacenado de forma local en el dispositivo.
resumen int	maxTokens() La longitud total de la caché kv.
resumen String	modelPath() La ruta de acceso que apunta al archivo de modelo de tflite.
resumen int	randomSeed() Valor inicial aleatorio para los tokens de muestreo.
abstracto Opcional<ProgressListener<String>>	resultListener() El objeto de escucha de resultados que se usará para la API de `ERROR(/LlmInference#generateAsync)`.
abstract float	temperatura() Aleatorización cuando se decodifica el siguiente token.
resumen int	topK() El Top K de tokens de los que se muestrear para cada paso de decodificación.

Métodos heredados

Desde la clase com.google.mediapipe.tasks.core.TaskOptions

Cualquiera	convertToAnyProto() Convierte las opciones específicas de tareas de MediaPipe Tasks en un mensaje `ERROR(/Any)` de proto3.
CalculatorOptions	convertToCalculatorOptionsProto() Convierte opciones específicas de tareas de MediaPipe Tasks en un mensaje protobuf `ERROR(/CalculatorOptions)`.

Desde la clase java.lang.Object

boolean	es igual a(Objeto arg0)
final Class<?>	getClass()
int	hashCode()
final void	notify()
final void	notifyAll()
String	toString()
final void	wait(long arg0, int arg1)
final void	wait(argumento largo)
final void	wait()

Constructores públicos

public LlmInferenceOptions ()

Métodos públicos

público estático LlmInference.LlmInferenceOptions.Builder builder ()

Crea una instancia de un compilador LlmInferenceOptions nuevo.

resumen público Opcional<ErrorListener> errorListener ()

El objeto de escucha de errores que se usa para la API de ERROR(/LlmInference#generateAsync).

public resumen Opcional<String> loraPath ()

Es la ruta de acceso absoluta al paquete de recursos del modelo de LoRA almacenado de forma local en el dispositivo. Solo es compatible con los modelos de GPU.

public resumen int maxTokens ()

La longitud total de la caché kv. En otras palabras, esta es la cantidad total de tokens de entrada y salida que el modelo debe controlar.

public resumen String modelPath ()

La ruta de acceso que apunta al archivo de modelo de tflite.

public resumen int randomSeed ()

Valor inicial aleatorio para los tokens de muestreo.

público abstracto Opcional<ProgressListener<String>> resultListener ()

El objeto de escucha de resultados que se usará para la API de ERROR(/LlmInference#generateAsync).

public resumen float temperatura ()

Aleatorización cuando se decodifica el siguiente token. Un valor de 0.0f significa una decodificación codiciosa.

public abstract int topK ()

El Top K de tokens de los que se muestrear para cada paso de decodificación. Un valor de 1 significa decodificación voraz.