LlmInference.LlmInferenceOptions

publiczna statyczna klasa abstrakcji LlmInference.LlmInferenceOptions

Opcje konfigurowania: LlmInference

klasa LlmInference.LlmInferenceOptions.Builder Kreator dla: LlmInference.LlmInferenceOptions.

LlmInferenceOptions()

static LlmInference.LlmInferenceOptions.Builder	builder() Tworzy instancję nowego kreatora LlmInferenceOptions.
abstract Optional<ErrorListener>	errorListener(). Detektor błędów używany przez interfejs `ERROR(/LlmInference#generateAsync)` API.
abstract Optional<Ciąg>	loraPath() Ścieżka bezwzględna do pakietu zasobów modelu LoRA zapisanego lokalnie na urządzeniu.
abstrakcja int	maxTokens() Całkowita długość pamięci podręcznej (kv).
abstrat Ciąg znaków	modelPath() Ścieżka wskazująca plik modelu tflite.
abstrakcja int	randomSeed() Losowy punkt początkowy tokenów próbkowania.
abstract Optional<ProgressListener<ciąg znaków>>	resultListener() Detektor wyników używany przez interfejs `ERROR(/LlmInference#generateAsync)` API.
abstrakcyjny zmiennoprzecinkowy	temperature() Losowość podczas dekodowania następnego tokena.
abstrakcja int	topK() Największa liczba K tokenów, z których ma być próbkowana w każdym kroku dekodowania.

Dowolny	convertToAnyProto() Konwertuje opcje związane z zadaniami MediaPipe Listy zadań w komunikat `ERROR(/Any)` proto3.
CalculatorOptions	convertToCalculatorOptionsProto() Konwertuje opcje związane z zadaniami MediaPipe na komunikat protokołu `ERROR(/CalculatorOptions)`.

Z klasy java.lang.Object

Konstruktorzy publiczni

Tworzy instancję nowego kreatora LlmInferenceOptions.

Detektor błędów używany przez interfejs ERROR(/LlmInference#generateAsync) API.

Ścieżka bezwzględna do pakietu zasobów modelu LoRA zapisanego lokalnie na urządzeniu. Ta funkcja jest zgodna tylko z modelami GPU.

Całkowita długość pamięci podręcznej (kv). Innymi słowy, jest to łączna liczba tokenów wejściowych i wyjściowych, które model musi obsłużyć.

Ścieżka wskazująca plik modelu tflite.

Losowy punkt początkowy tokenów próbkowania.

Detektor wyników używany przez interfejs ERROR(/LlmInference#generateAsync) API.

Losowość podczas dekodowania następnego tokena. Wartość 0,0f oznacza dekodowanie zachłanne.

Największa liczba K tokenów, z których ma być próbkowana w każdym kroku dekodowania. Wartość 1 oznacza dekodowanie zachłanne.