Hướng dẫn phát hiện ngôn ngữ

Nhiệm vụ Trình phát hiện ngôn ngữ MediaPipe cho phép bạn xác định ngôn ngữ của một đoạn văn bản. Tác vụ này hoạt động trên dữ liệu văn bản bằng mô hình học máy (ML) và đưa ra một danh sách các dự đoán, trong đó mỗi dự đoán bao gồm một mã ngôn ngữ ISO 639-1 và một xác suất.

Hãy dùng thử!

Bắt đầu

Hãy bắt đầu sử dụng tác vụ này bằng cách làm theo một trong những hướng dẫn triển khai sau cho nền tảng mục tiêu của bạn. Các hướng dẫn dành riêng cho nền tảng này sẽ hướng dẫn bạn cách triển khai cơ bản của tác vụ này, bao gồm cả mô hình được đề xuất và mã ví dụ với các lựa chọn cấu hình được đề xuất:

Thông tin chi tiết về việc cần làm

Phần này mô tả các tính năng, dữ liệu đầu vào, đầu ra và tuỳ chọn cấu hình của tác vụ này.

Tính năng

  • Ngưỡng điểm số – Lọc kết quả dựa trên điểm dự đoán
  • Gắn nhãn danh sách cho phép và danh sách từ chối – Chỉ định các danh mục được phát hiện
Dữ liệu đầu vào của việc cần làm Kết quả đầu ra của nhiệm vụ
Trình phát hiện ngôn ngữ chấp nhận loại dữ liệu đầu vào sau:
  • Chuỗi
Trình phát hiện ngôn ngữ đưa ra danh sách các cụm từ gợi ý chứa:
    • Mã ngôn ngữ: Mã ngôn ngữ/mã ngôn ngữ theo ISO 639-1 (https://en.wikipedia.org/wiki / List_of_ISO_639-1_codes) (ví dụ: "en" cho tiếng Anh, "uz" cho tiếng Uzbek, "ja-Latn" cho tiếng Nhật (romaji)) ở dạng chuỗi.
    • Xác suất: điểm số tin cậy cho thông tin dự đoán này, được biểu thị bằng xác suất từ 0 đến 1 dưới dạng giá trị dấu phẩy động.

Lựa chọn về cấu hình

Tác vụ này có các chế độ cấu hình sau:

Tên lựa chọn Nội dung mô tả Khoảng giá trị Giá trị mặc định
max_results Đặt số lượng tối đa các cụm từ dự đoán ngôn ngữ được điểm số cao nhất (không bắt buộc) để trả về. Nếu giá trị này nhỏ hơn 0, thì mọi kết quả có sẵn đều được trả về. Số dương bất kỳ -1
score_threshold Đặt ngưỡng điểm dự đoán để ghi đè ngưỡng được cung cấp trong siêu dữ liệu mô hình (nếu có). Những kết quả bên dưới giá trị này sẽ bị từ chối. Số thực bất kỳ Không đặt
category_allowlist Đặt danh sách mã ngôn ngữ được phép (không bắt buộc). Nếu không để trống, các cụm từ dự đoán ngôn ngữ có mã ngôn ngữ không thuộc tập hợp này sẽ bị lọc ra. Tuỳ chọn này loại trừ lẫn nhau với category_denylist và việc sử dụng cả hai sẽ gây ra lỗi. Chuỗi bất kỳ Không đặt
category_denylist Đặt danh sách mã ngôn ngữ không được phép (không bắt buộc). Nếu không trống, các dự đoán ngôn ngữ có mã ngôn ngữ trong tập hợp này sẽ bị lọc ra. Tuỳ chọn này loại trừ lẫn nhau với category_allowlist và việc sử dụng cả hai sẽ dẫn đến lỗi. Chuỗi bất kỳ Không đặt

Mô hình

Chúng tôi đưa ra một mô hình mặc định, được đề xuất khi bạn bắt đầu phát triển bằng tác vụ này.

Mô hình này có kích thước nhẹ (315 KB) và sử dụng kiến trúc phân loại mạng nơron dựa trên nhúng. Mô hình này xác định ngôn ngữ bằng mã ngôn ngữ theo ISO 639-1 và có thể xác định 110 ngôn ngữ. Để biết danh sách ngôn ngữ mà mô hình hỗ trợ, hãy xem tệp nhãn. Tệp này liệt kê các ngôn ngữ theo mã ISO 639-1.

Tên mẫu thiết bị Hình dạng dữ liệu đầu vào Loại lượng tử hoá Thẻ mô hình Phiên bản
Trình phát hiện ngôn ngữ chuỗi UTF-8 không có (float32) thông tin Mới nhất

Điểm chuẩn nhiệm vụ

Dưới đây là các điểm chuẩn tác vụ cho toàn bộ quy trình dựa trên các mô hình được huấn luyện trước ở trên. Kết quả về độ trễ là độ trễ trung bình trên Pixel 6 khi sử dụng CPU / GPU.

Tên mô hình Độ trễ của CPU Độ trễ của GPU
Trình phát hiện ngôn ngữ 0,31 mili giây -