MediaPipe Dil Algılayıcı görevi, bir metnin dilini belirlemenize olanak tanır. Bu görev, makine öğrenimi (ML) modeli ile metin verilerinde çalışır ve her biri bir ISO 639-1 dil kodundan ve olasılıktan oluşan bir tahmin listesi döndürür.
Başlayın
Hedef platformunuzla ilgili bu uygulama kılavuzlarından birini uygulayarak bu görevi kullanmaya başlayın. Platforma özel bu kılavuzlar, önerilen bir model ve önerilen yapılandırma seçenekleriyle birlikte kod örneği de dahil olmak üzere bu görevin temel uygulama sürecinde size yol gösterir:
- Android - Kod örneği - Kılavuz
- Python - Kod örneği - Kılavuz
- Web - Kod örneği - Kılavuz
Görev ayrıntıları
Bu bölümde, bu görevin özellikleri, girişleri, çıkışları ve yapılandırma seçenekleri açıklanmaktadır.
Özellikler
- Puan eşiği: Sonuçları tahmin puanlarına göre filtreleyin
- İzin verilenler ve reddedilenler etiket listesi: Tespit edilen kategorileri belirtin.
Görev girişleri | Görev çıkışları |
---|---|
Dil Tanımlayıcı, aşağıdaki giriş veri türünü kabul eder:
|
Dil algılayıcı, aşağıdakileri içeren bir tahmin listesi döndürür:
|
Yapılandırma seçenekleri
Bu görev için aşağıdaki yapılandırma seçenekleri vardır:
Seçenek Adı | Açıklama | Değer Aralığı | Varsayılan değer |
---|---|---|---|
max_results |
Döndürülecek isteğe bağlı maksimum sayıdaki en yüksek puan alan dil tahminlerini ayarlar. Bu değer sıfırdan azsa mevcut tüm sonuçlar döndürülür. | Tüm pozitif sayılar | -1 |
score_threshold |
Model meta verilerinde (varsa) sağlanan eşiği geçersiz kılan tahmin puanı eşiğini belirler. Bu değerin altındaki sonuçlar reddedilir. | Herhangi bir kayan nokta | Ayarlanmadı |
category_allowlist |
İzin verilen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse dil kodu bu kümede olmayan dil tahminleri filtrelenir. Bu seçenek, category_denylist ile birbirini hariç tutar ve her ikisinin de kullanılması hatayla sonuçlanır. |
Herhangi bir dize | Ayarlanmadı |
category_denylist |
İzin verilmeyen dil kodlarının isteğe bağlı listesini belirler. Boş değilse dil kodu bu kümede olan dil tahminleri filtrelenir. Bu seçenek, category_allowlist ile birbirini hariç tutar ve her ikisinin de kullanılması hatayla sonuçlanır. |
Herhangi bir dize | Ayarlanmadı |
Modeller
Bu görevle geliştirmeye başladığınızda varsayılan olarak önerilen bir model sunarız.
Dil algılayıcı modeli (önerilen)
Bu model, hafif (315 KB) olacak şekilde tasarlanmıştır ve yerleştirme tabanlı, sinir ağı sınıflandırma mimarisi kullanır. Model, ISO 639-1 dil kodunu kullanarak dili tanımlar ve 110 dili tanımlayabilir. Modelin desteklediği dillerin listesi için dilleri ISO 639-1 kodlarına göre listeleyen etiket dosyasına bakın.
Model adı | Giriş şekli | Kesirli sayılaştırma türü | Model kartı | Sürümler |
---|---|---|---|---|
Dil Algılayıcı | dize UTF-8 | yok (float32) | info | En son |
Görev karşılaştırmaları
Yukarıdaki önceden eğitilmiş modellere dayalı olarak tüm ardışık düzenin görev karşılaştırmalarını aşağıda bulabilirsiniz. Gecikme sonucu, CPU / GPU kullanan Pixel 6'taki ortalama gecikmedir.
Model Adı | CPU Gecikmesi | GPU Gecikmesi |
---|---|---|
Dil algılama | 0,31 ms | - |