LlmInference.LlmInferenceOptions

מחלקה מופשטת סטטית ציבורית LlmInference.LlmInferenceOptions

אפשרויות להגדרת LlmInference.

מחלקה LlmInference.LlmInferenceOptions.Builder בנאי של LlmInference.LlmInferenceOptions.

LlmInferenceOptions()

סטטי LlmInference.LlmInferenceOptions.Builder	builder() יצירת גרסה חדשה של הכלי LlmInferenceOptions.
מופשט אופציונלי<ErrorListener>	errorListener() האזנה לשגיאות לשימוש עבור ה-API של `ERROR(/LlmInference#generateAsync)`.
מופשט אופציונלי<מחרוזת>	loraPath() הנתיב המוחלט לחבילת הנכסים של דגם LoRA שנשמרה באופן מקומי במכשיר.
מופשט int	maxTokens() האורך הכולל של kv-cache.
מופשט מחרוזת	modelPath() הנתיב שמפנה לקובץ המודל של tflite.
מופשט int	randomSeed() מקור אקראי לדגימה של אסימונים.
מופשט אופציונלי<ProgressListener<String>>	resultListener() האזנה לתוצאה לשימוש עבור ה-API של `ERROR(/LlmInference#generateAsync)`.
מופשט מספר ממשי (float)	Temperature() אקראיות בפענוח האסימון הבא.
מופשט int	topK() מספר ה-K של האסימונים שבהם יש לדגום את כל שלב בפענוח הקידוד.

כל צבע	convertToAnyProto() ההמרה של אפשרויות ספציפיות למשימה של MediaPipe Tasks להודעת `ERROR(/Any)` Proto3.
CalculatorOptions	convertToCalculatorOptionsProto() ההמרה של אפשרויות ספציפיות למשימה של MediaPipe Tasks להודעת `ERROR(/CalculatorOptions)` protobuf.

מהכיתה Java.lang.Object

בנאים ציבוריים

יצירת גרסה חדשה של הכלי LlmInferenceOptions.

האזנה לשגיאות לשימוש עבור ה-API של ERROR(/LlmInference#generateAsync).

הנתיב המוחלט לחבילת הנכסים של דגם LoRA שנשמרה באופן מקומי במכשיר. האפשרות הזו תואמת רק למודלים של GPU.

האורך הכולל של kv-cache. במילים אחרות, זהו המספר הכולל של אסימוני קלט + פלט שהמודל צריך לטפל בהם.

הנתיב שמפנה לקובץ המודל של tflite.

מקור אקראי לדגימה של אסימונים.

האזנה לתוצאה לשימוש עבור ה-API של ERROR(/LlmInference#generateAsync).

אקראיות בפענוח האסימון הבא. הערך 0.0f משמעו פענוח באמצעות אלגוריתם חמדן (Greedy).

מספר ה-K של האסימונים שבהם יש לדגום את כל שלב בפענוח הקידוד. הערך 1 משמעו פענוח באמצעות אלגוריתם חמדן (Greedy).