LlmInference.LlmInferenceOptions

public static abstract class LlmInference.LlmInferenceOptions

Optionen zum Einrichten eines LlmInference-Objekts.

Verschachtelte Klassen

Klasse LlmInference.LlmInferenceOptions.Builder Builder für LlmInference.LlmInferenceOptions.

Public Constructors

LlmInferenceOptions()

Public Methods

static LlmInference.LlmInferenceOptions.Builder	builder() Instanziiert einen neuen LlmInferenceOptions-Builder.
abstrakt Optional<ErrorListener>	errorListener() Der für die `ERROR(/LlmInference#generateAsync)` API zu verwendende Fehler-Listener.
abstrakt Optional<String>	loraPath() Der absolute Pfad zum Asset-Bundle für das LoRA-Modell, das lokal auf dem Gerät gespeichert ist.
Abstrakt Int	maxTokens() Die Gesamtlänge des kv-Cache.
Zusammenfassung String	modelPath() Der Pfad, der auf die TFlite-Modelldatei verweist.
Abstrakt Int	randomSeed() Zufälliger Startwert für Stichprobentokens.
abstrakt Optional<ProgressListener<String>>	resultListener() Der Ergebnis-Listener, der für die `ERROR(/LlmInference#generateAsync)` API verwendet werden soll.
Abstrakte Gleitkommazahl	temperature() Zufälligkeit beim Decodieren des nächsten Tokens.
Abstrakt Int	topK() Top-K-Anzahl von Tokens, aus denen für jeden Decodierungsschritt eine Stichprobe erstellt werden soll.

Übernommene Methoden

Aus Klasse com.google.mediapipe.tasks.core.TaskOptions

Alle	convertToAnyProto() Konvertiert eine aufgabenspezifische MediaPipe Tasks-Optionen in eine `ERROR(/Any)`-Proto3-Nachricht.
CalculatorOptions	convertToCalculatorOptionsProto() Konvertiert eine aufgabenspezifische MediaPipe Tasks-Optionen in eine `ERROR(/CalculatorOptions)`-Protokollzwischenspeicher-Nachricht.

Aus Klasse java.lang.Object

boolean	equals(Objekt arg0)
final Class<?>	getClass()
int	hashCode()
endgültig void	notify()
endgültig void	notifyAll()
String	toString()
endgültig void	wait(long arg0, int arg1)
endgültig void	wait(lange arg0)
endgültig void	wait()

Public Constructors

public LlmInferenceOptions ()

Public Methods

public static LlmInference.LlmInferenceOptions.Builder builder ()

Instanziiert einen neuen LlmInferenceOptions-Builder.

public abstrakt Optional<ErrorListener> errorListener ()

Der für die ERROR(/LlmInference#generateAsync) API zu verwendende Fehler-Listener.

public abstrakt Optional<String> loraPath ()

Der absolute Pfad zum Asset-Bundle für das LoRA-Modell, das lokal auf dem Gerät gespeichert ist. Dies ist nur mit GPU-Modellen kompatibel.

public abstrakt int maxTokens ()

Die Gesamtlänge des kv-Cache. Mit anderen Worten, dies ist die Gesamtzahl der Eingabe- und Ausgabetokens, die das Modell verarbeiten muss.

public abstrakt String modelPath ()

Der Pfad, der auf die TFlite-Modelldatei verweist.

public abstrakt int randomSeed ()

Zufälliger Startwert für Stichprobentokens.

public abstrakt Optional<ProgressListener<String>> resultListener ()

Der Ergebnis-Listener, der für die ERROR(/LlmInference#generateAsync) API verwendet werden soll.

öffentliches abstraktes Gleitkommazahl Temperatur ()

Zufälligkeit beim Decodieren des nächsten Tokens. Ein Wert von 0.0f bedeutet, dass die Decodierung ungeschickt ist.

public abstrakt int topK ()

Top-K-Anzahl von Tokens, aus denen für jeden Decodierungsschritt eine Stichprobe erstellt werden soll. Ein Wert von 1 bedeutet: ungefilterte Decodierung.