MediaPipe Dil Dedektörü görevi, bir metin parçasının dilini tanımlamanızı sağlar. Bu görev, makine öğrenimi (ML) modeliyle metin verileri üzerinde çalışır ve her tahminin bir ISO 639-1 dil kodundan ve bir olasılıktan oluştuğu bir tahmin listesi oluşturur.
Başlayın
Hedef platformunuz için bu uygulama rehberlerinden birini izleyerek bu görevi kullanmaya başlayın. Bu platforma özel kılavuzlar, önerilen bir model ve önerilen yapılandırma seçenekleriyle birlikte kod örneği dahil olmak üzere, bu görevin temel bir şekilde uygulanmasında size yol gösterir:
- Android - Kod örneği - Kılavuz
- Python - Kod örneği - Kılavuz
- Web - Kod örneği - Kılavuz
Görev ayrıntıları
Bu bölümde, bu görevin özellikleri, girişleri, çıkışları ve yapılandırma seçenekleri açıklanmaktadır.
Özellikler
- Puan eşiği - Sonuçları tahmin puanlarına göre filtreleyin
- Etiket izin verilenler listesi ve ret listesi - Algılanan kategorileri belirtin
Görev girişleri | Görev çıkışları |
---|---|
Dil Algılayıcı şu giriş verisi türünü kabul eder:
|
Dil Algılayıcı, aşağıdakileri içeren bir tahmin listesi oluşturur:
|
Yapılandırma seçenekleri
Bu görev aşağıdaki yapılandırma seçeneklerine sahiptir:
Seçenek Adı | Açıklama | Değer Aralığı | Varsayılan Değer |
---|---|---|---|
max_results |
İsteğe bağlı olarak, döndürülecek en yüksek puanlı dil tahmininin maksimum sayısını ayarlar. Bu değer sıfırdan küçükse mevcut tüm sonuçlar döndürülür. | Pozitif sayılar | -1 |
score_threshold |
Model meta verilerinde belirtilen eşiği (varsa) geçersiz kılan tahmin puanı eşiğini ayarlar. Bu değerin altındaki sonuçlar reddedilir. | Tüm kayan | Belirlenmedi |
category_allowlist |
İzin verilen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse, dil kodu bu grupta yer almayan dil tahminleri filtrelenir. Bu seçenek category_denylist ile birlikte kullanılamaz ve her iki sonucun da kullanılması hataya neden olur. |
Herhangi bir dize | Belirlenmedi |
category_denylist |
İzin verilmeyen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse dil kodu bu kümede yer alan dil tahminleri filtrelenir. Bu seçenek, category_allowlist ile birlikte kullanılamaz ve her iki sonucun da kullanılması hataya neden olur. |
Herhangi bir dize | Belirlenmedi |
Modeller
Bu görevle geliştirmeye başladığınızda varsayılan, önerilen bir model sunarız.
Dil algılayıcı modeli (önerilir)
Bu model, hafif (315 KB) olacak şekilde tasarlanmıştır ve yerleştirme tabanlı, nöral ağ sınıflandırma mimarisi kullanır. Model, dili ISO 639-1 dil kodu kullanarak tanımlar ve 110 dili tanımlayabilir. Modelin desteklediği dillerin listesi için dilleri ISO 639-1 kodlarına göre listeleyen etiket dosyasına bakın.
Model adı | Giriş şekli | Nicelleştirme türü | Model kartı | Sürümler |
---|---|---|---|---|
Dil Algılayıcı | dize UTF-8 | yok (float32) | bilgi | En son |
Görev karşılaştırmaları
Yukarıda önceden eğitilmiş modellere dayalı olarak ardışık düzenin tamamı için görev karşılaştırmaları aşağıda verilmiştir. Gecikme sonucu, Pixel 6'da CPU / GPU kullanılarak elde edilen ortalama gecikmedir.
Model Adı | CPU Gecikmesi | GPU Gecikmesi |
---|---|---|
Dil Algılayıcı | 0,31 ms. | - |