언어 코드: ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) 언어 / 지역 코드 (예: 영어의 경우 'en', 우즈베크어의 경우 'uz', 일본어 (로마지)의 경우 'ja-Latn')입니다.
확률: 이 예측의 신뢰도 점수로, 0과 1 사이의 확률로 부동 소수점 값으로 표현됩니다.
구성 옵션
이 태스크에는 다음과 같은 구성 옵션이 있습니다.
옵션 이름
설명
값 범위
기본값
max_results
반환할 최고 점수가 매겨진 언어 예상 검색어의 최대 개수를 설정합니다(선택사항). 이 값이 0보다 작으면 사용 가능한 모든 결과가 반환됩니다.
모든 양수
-1
score_threshold
모델 메타데이터에서 제공된 값 (있는 경우)을 재정의하는 예측 점수 임곗값을 설정합니다. 이 값보다 낮은 결과는 거부됩니다.
모든 플로팅
설정되지 않음
category_allowlist
허용되는 언어 코드의 선택적 목록을 설정합니다. 비어 있지 않으면 언어 코드가 이 세트에 없는 언어 예측은 필터링됩니다. 이 옵션은 category_denylist와 함께 사용할 수 없으며 두 옵션을 모두 사용하면 오류가 발생합니다.
모든 문자열
설정되지 않음
category_denylist
허용되지 않는 언어 코드의 목록(선택사항)을 설정합니다. 비어 있지 않으면 언어 코드가 이 세트에 있는 언어 예측은 필터링됩니다. 이 옵션은 category_allowlist와 상호 배타적이며 둘 다 사용하면 오류가 발생합니다.
모든 문자열
설정되지 않음
모델
이 작업으로 개발을 시작할 때 권장되는 기본 모델이 제공됩니다.
언어 감지기 모델 (권장)
이 모델은 경량 (315KB)으로 제작되었으며 임베딩 기반의 신경망 분류 아키텍처를 사용합니다. 모델은 ISO 639-1 언어 코드를 사용하여 언어를 식별하며 110개 언어를 식별할 수 있습니다. 모델에서 지원하는 언어 목록은 ISO 639-1 코드로 언어를 나열하는 라벨 파일을 참조하세요.