LlmInference.LlmInferenceOptions

public static abstract class LlmInference.LlmInferenceOptions

Optionen zum Einrichten eines LlmInference-Objekts.

Verschachtelte Klassen

Klasse LlmInference.LlmInferenceOptions.Builder Builder für LlmInference.LlmInferenceOptions

Public Constructors

Public Methods

static LlmInference.LlmInferenceOptions.Builder
builder()
Instanziiert einen neuen LlmInferenceOptions-Builder.
abstrakt Optional<ErrorListener>
errorListener()
Der für die ERROR(/LlmInference#generateAsync) API zu verwendende Fehler-Listener.
abstrakt Optional<String>
loraPath()
Der absolute Pfad zum Asset-Bundle für das LoRA-Modell, das lokal auf dem Gerät gespeichert ist.
Abstrakt Int
maxTokens()
Die Gesamtlänge des kv-Cache.
Zusammenfassung String
modelPath()
Der Pfad, der auf die TFlite-Modelldatei verweist.
Abstrakt Int
randomSeed()
Zufälliger Startwert für Stichprobentokens.
abstrakt Optional<ProgressListener<String>>
resultListener()
Der Ergebnis-Listener, der für die ERROR(/LlmInference#generateAsync) API verwendet werden soll.
Abstrakte Gleitkommazahl
temperature()
Zufälligkeit beim Decodieren des nächsten Tokens.
Abstrakt Int
topK()
Top-K-Anzahl von Tokens, aus denen für jeden Decodierungsschritt eine Stichprobe erstellt werden soll.

Übernommene Methoden

Public Constructors

public LlmInferenceOptions ()

Public Methods

public static LlmInference.LlmInferenceOptions.Builder builder ()

Instanziiert einen neuen LlmInferenceOptions-Builder.

public abstrakt Optional<ErrorListener> errorListener ()

Der für die ERROR(/LlmInference#generateAsync) API zu verwendende Fehler-Listener.

public abstrakt Optional<String> loraPath ()

Der absolute Pfad zum Asset-Bundle für das LoRA-Modell, das lokal auf dem Gerät gespeichert ist. Dies ist nur mit GPU-Modellen kompatibel.

public abstrakt int maxTokens ()

Die Gesamtlänge des kv-Cache. Mit anderen Worten, dies ist die Gesamtzahl der Eingabe- und Ausgabetokens, die das Modell verarbeiten muss.

public abstrakt String modelPath ()

Der Pfad, der auf die TFlite-Modelldatei verweist.

public abstrakt int randomSeed ()

Zufälliger Startwert für Stichprobentokens.

public abstrakt Optional<ProgressListener<String>> resultListener ()

Der Ergebnis-Listener, der für die ERROR(/LlmInference#generateAsync) API verwendet werden soll.

öffentliches abstraktes Gleitkommazahl Temperatur ()

Zufälligkeit beim Decodieren des nächsten Tokens. Ein Wert von 0.0f bedeutet, dass die Decodierung ungeschickt ist.

public abstrakt int topK ()

Top-K-Anzahl von Tokens, aus denen für jeden Decodierungsschritt eine Stichprobe erstellt werden soll. Ein Wert von 1 bedeutet: ungefilterte Decodierung.