LlmInference.LlmInferenceOptions

class abstrak statis publik LlmInference.LlmInferenceOptions

Opsi untuk menyiapkan LlmInference.

class LlmInference.LlmInferenceOptions.Builder Builder untuk LlmInference.LlmInferenceOptions.

LlmInferenceOptions()

statis LlmInference.LlmInferenceOptions.Builder	builder() Membuat instance builder LlmInferenceOptions baru.
abstrak Opsional<ErrorListener>	errorListener() Pemroses error yang akan digunakan untuk `ERROR(/LlmInference#generateAsync)` API.
abstrak Opsional<String>	loraPath() Jalur absolut ke paket aset model LoRA yang disimpan secara lokal di perangkat.
abstrak int	maxTokens() Panjang total kv-cache.
abstrak String	modelPath() Jalur yang mengarah ke file model tflite.
abstrak int	randomSeed() Seed acak untuk token pengambilan sampel.
abstract Opsional<ProgressListener<String>>	resultListener() Pemroses hasil yang akan digunakan untuk `ERROR(/LlmInference#generateAsync)` API.
float abstrak	suhu() Keacakan saat mendekode token berikutnya.
abstrak int	topK() Jumlah token K teratas yang akan diambil sampelnya untuk setiap langkah decoding.

Mana saja	convertToAnyProto() Mengonversi opsi khusus tugas MediaPipe Tasks menjadi pesan `ERROR(/Any)` proto3.
CalculatorOptions	convertToCalculatorOptionsProto() Mengonversi opsi khusus tugas MediaPipe Tasks menjadi pesan protobuf `ERROR(/CalculatorOptions)`.

Dari class java.lang.Object

Konstruktor Publik

Membuat instance builder LlmInferenceOptions baru.

Pemroses error yang akan digunakan untuk ERROR(/LlmInference#generateAsync) API.

Jalur absolut ke paket aset model LoRA yang disimpan secara lokal di perangkat. Opsi ini hanya kompatibel dengan model GPU.

Panjang total kv-cache. Dengan kata lain, ini adalah jumlah total token input + output yang perlu ditangani model.

Jalur yang mengarah ke file model tflite.

Seed acak untuk token pengambilan sampel.

Pemroses hasil yang akan digunakan untuk ERROR(/LlmInference#generateAsync) API.

Keacakan saat mendekode token berikutnya. Nilai 0.0f berarti decoding serakah.

Jumlah token K teratas yang akan diambil sampelnya untuk setiap langkah decoding. Nilai 1 berarti decoding yang serakah.