LlmInference.LlmInferenceOptions

lớp trừu tượng tĩnh công khai LlmInference.LlmInferenceOptions

Các tuỳ chọn để thiết lập LlmInference.

lớp LlmInference.LlmInferenceOptions.Builder Trình tạo cho LlmInference.LlmInferenceOptions.

Hàm LlmInferenceOptions()

tĩnh LlmInference.LlmInferenceOptions.Builder	trình tạo() Tạo thực thể cho trình tạo LlmInferenceOptions mới.
trừu tượng Không bắt buộc<ErrorListener>	Hàm errorListener() Trình nghe lỗi để sử dụng cho API `ERROR(/LlmInference#generateAsync)`.
trừu tượng Không bắt buộc<String>	Hàm loraPath() Đường dẫn tuyệt đối đến gói tài sản mô hình LoRA được lưu trữ trên thiết bị.
trừu tượng int	maxTokens() Tổng chiều dài của kv-cache.
trừu tượng Chuỗi	modelPath() Đường dẫn trỏ đến tệp mô hình tflite.
trừu tượng int	Hàm randomSeed() Nội dung gốc ngẫu nhiên cho mã thông báo lấy mẫu.
trừu tượng Không bắt buộc<ProgressListener<String>>	Hàm resultListener() Trình nghe kết quả để sử dụng cho API `ERROR(/LlmInference#generateAsync)`.
trừu tượng số thực có độ chính xác	nhiệt độ() Tính ngẫu nhiên khi giải mã mã thông báo tiếp theo.
trừu tượng int	topK() Số lượng mã thông báo K hàng đầu được lấy mẫu cho mỗi bước giải mã.

Bất kỳ	convertToAnyProto() Chuyển đổi một tuỳ chọn dành riêng cho tác vụ của MediaPipe Tasks thành thông báo `ERROR(/Any)` proto3.
CalculatorOptions	convertToCalculatorOptionsProto() Chuyển đổi một tuỳ chọn dành riêng cho tác vụ của MediaPipe Tasks thành thông báo protobuf `ERROR(/CalculatorOptions)`.

Từ lớp java.lang.Object

Công trình công cộng

Tạo thực thể cho trình tạo LlmInferenceOptions mới.

Trình nghe lỗi để sử dụng cho API ERROR(/LlmInference#generateAsync).

Đường dẫn tuyệt đối đến gói tài sản mô hình LoRA được lưu trữ trên thiết bị. Tính năng này chỉ tương thích với các mẫu GPU.

Tổng chiều dài của kv-cache. Nói cách khác, đây là tổng số mã thông báo đầu vào + đầu ra mà mô hình cần xử lý.

Đường dẫn trỏ đến tệp mô hình tflite.

Nội dung gốc ngẫu nhiên cho mã thông báo lấy mẫu.

Trình nghe kết quả để sử dụng cho API ERROR(/LlmInference#generateAsync).

Tính ngẫu nhiên khi giải mã mã thông báo tiếp theo. Giá trị 0,0f có nghĩa là giải mã tham lam.

Số lượng mã thông báo K hàng đầu được lấy mẫu cho mỗi bước giải mã. Giá trị 1 có nghĩa là quá trình giải mã tham lam.