LlmInference.LlmInferenceOptions

คลาสนามธรรมแบบคงที่สาธารณะ LlmInference.LlmInferenceOptions

ตัวเลือกในการตั้งค่าLlmInference

ชั้นเรียนที่ซ้อนกัน

คลาส LlmInference.LlmInferenceOptions.Builder เครื่องมือสร้างสำหรับ LlmInference.LlmInferenceOptions 

บริษัทก่อสร้าง

วิธีการสาธารณะ

ภาพนิ่ง LlmInference.LlmInferenceOptions.Builder
เครื่องมือสร้าง()
ยกตัวอย่างเครื่องมือสร้าง LlmInferenceOptions ใหม่
abstract ไม่บังคับ<ErrorListener>
errorListener()
Listener ข้อผิดพลาดที่จะใช้กับ API ERROR(/LlmInference#generateAsync)
abstract ไม่บังคับ<สตริง>
loraPath()
Absolute Path ที่นำไปยังแพ็กเกจเนื้อหาโมเดล LoRA ที่จัดเก็บไว้ในอุปกรณ์
นามธรรม int
maxTokens()
ความยาวทั้งหมดของแคช kv
abstract สตริง
modelPath()
เส้นทางที่ชี้ไปยังไฟล์โมเดล tflite
นามธรรม int
randomSeed()
เมล็ดแบบสุ่มสำหรับโทเค็นการสุ่มตัวอย่าง
abstract ไม่บังคับ<ProgressListener<String>>
resultListener()
Listener ผลลัพธ์ที่จะใช้กับ ERROR(/LlmInference#generateAsync) API
นามธรรม ลอย
อุณหภูมิ()
การสุ่มเมื่อถอดรหัสโทเค็นถัดไป
นามธรรม int
topK()
จำนวนโทเค็นสูงสุด K ที่จะใช้เป็นตัวอย่างสำหรับขั้นตอนการถอดรหัสแต่ละขั้นตอน

วิธีการที่รับช่วงมา

บริษัทก่อสร้าง

สาธารณะ LlmInferenceOptions ()

วิธีการสาธารณะ

สาธารณะ คงที่ LlmInference.LlmInferenceOptions.Builder เครื่องมือสร้าง ()

ยกตัวอย่างเครื่องมือสร้าง LlmInferenceOptions ใหม่

สาธารณะ นามธรรม ไม่บังคับ<ErrorListener> errorListener ()

Listener ข้อผิดพลาดที่จะใช้กับ API ERROR(/LlmInference#generateAsync)

สาธารณะ นามธรรม ไม่บังคับ<สตริง> loraPath ()

Absolute Path ที่นำไปยังแพ็กเกจเนื้อหาโมเดล LoRA ที่จัดเก็บไว้ในอุปกรณ์ ฟีเจอร์นี้ใช้ได้กับรุ่น GPU เท่านั้น

สาธารณะ นามธรรม int maxTokens ()

ความยาวทั้งหมดของแคช kv กล่าวคือ นี่เป็นจำนวนโทเค็นอินพุต + เอาต์พุตทั้งหมดที่โมเดลต้องจัดการ

สาธารณะ นามธรรม สตริง modelPath ()

เส้นทางที่ชี้ไปยังไฟล์โมเดล tflite

สาธารณะ นามธรรม int randomSeed ()

เมล็ดแบบสุ่มสำหรับโทเค็นการสุ่มตัวอย่าง

Public abstract ไม่บังคับ<ProgressListener<String>> resultListener ()

Listener ผลลัพธ์ที่จะใช้กับ ERROR(/LlmInference#generateAsync) API

สาธารณะ นามธรรม ทศนิยม อุณหภูมิ ()

การสุ่มเมื่อถอดรหัสโทเค็นถัดไป ค่า 0.0f หมายถึงการถอดรหัสอย่างละโมบ

สาธารณะ นามธรรม int topK ()

จำนวนโทเค็นสูงสุด K ที่จะใช้เป็นตัวอย่างสำหรับขั้นตอนการถอดรหัสแต่ละขั้นตอน ค่า 1 หมายถึงการถอดรหัสอย่างละโมบ