LlmInference.LlmInferenceOptions

공개 정적 추상 클래스 LlmInference.LlmInferenceOptions

LlmInference 설정 옵션

클래스 LlmInference.LlmInferenceOptions.Builder LlmInference.LlmInferenceOptions의 빌더입니다.

LlmInferenceOptions()

static LlmInference.LlmInferenceOptions.Builder	builder() 새 LlmInferenceOptions 빌더를 인스턴스화합니다.
추상 선택<ErrorListener>	errorListener() `ERROR(/LlmInference#generateAsync)` API에 사용할 오류 리스너입니다.
추상 선택사항<String>	loraPath() 기기에 로컬로 저장된 LoRA 모델 애셋 번들의 절대 경로입니다.
추상 정수	maxTokens() kv-캐시의 총 길이입니다.
추상 문자열	modelPath() tflite 모델 파일을 가리키는 경로입니다.
추상 정수	randomSeed() 토큰 샘플링을 위한 랜덤 시드입니다.
추상 선택사항<ProgressListener<String>>	resultListener() `ERROR(/LlmInference#generateAsync)` API에 사용할 결과 리스너입니다.
추상 부동 소수점	temperature() 다음 토큰을 디코딩할 때의 무작위성입니다.
추상 정수	topK() 각 디코딩 단계에서 샘플링될 상위 K개의 토큰 수입니다.

모두	convertToAnyProto() MediaPipe Tasks 태스크별 옵션을 proto3 `ERROR(/Any)` 메시지로 변환합니다.
CalculatorOptions	convertToCalculatorOptionsProto() MediaPipe 태스크 작업별 옵션을 `ERROR(/CalculatorOptions)` protobuf 메시지로 변환합니다.

java.lang.Object 클래스에서 상속됨

공개 생성자

새 LlmInferenceOptions 빌더를 인스턴스화합니다.

ERROR(/LlmInference#generateAsync) API에 사용할 오류 리스너입니다.

기기에 로컬로 저장된 LoRA 모델 애셋 번들의 절대 경로입니다. 이는 GPU 모델과만 호환됩니다.

kv-캐시의 총 길이입니다. 즉, 모델이 처리해야 하는 입력 + 출력 토큰의 총 개수입니다.

tflite 모델 파일을 가리키는 경로입니다.

토큰 샘플링을 위한 랜덤 시드입니다.

ERROR(/LlmInference#generateAsync) API에 사용할 결과 리스너입니다.

다음 토큰을 디코딩할 때의 무작위성입니다. 0.0f 값은 그리디 디코딩을 의미합니다.

각 디코딩 단계에서 샘플링될 상위 K개의 토큰 수입니다. 값 1은 그리디 디코딩을 의미합니다.