Dil algılama kılavuzu

MediaPipe Dil Dedektörü görevi, bir metin parçasının dilini tanımlamanızı sağlar. Bu görev, makine öğrenimi (ML) modeliyle metin verileri üzerinde çalışır ve her tahminin bir ISO 639-1 dil kodundan ve bir olasılıktan oluştuğu bir tahmin listesi oluşturur.

Deneyin!

Başlayın

Hedef platformunuz için bu uygulama rehberlerinden birini izleyerek bu görevi kullanmaya başlayın. Bu platforma özel kılavuzlar, önerilen bir model ve önerilen yapılandırma seçenekleriyle birlikte kod örneği dahil olmak üzere, bu görevin temel bir şekilde uygulanmasında size yol gösterir:

Görev ayrıntıları

Bu bölümde, bu görevin özellikleri, girişleri, çıkışları ve yapılandırma seçenekleri açıklanmaktadır.

Özellikler

  • Puan eşiği - Sonuçları tahmin puanlarına göre filtreleyin
  • Etiket izin verilenler listesi ve ret listesi - Algılanan kategorileri belirtin
Görev girişleri Görev çıkışları
Dil Algılayıcı şu giriş verisi türünü kabul eder:
  • Dize
Dil Algılayıcı, aşağıdakileri içeren bir tahmin listesi oluşturur:
    • Dil kodu: ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) dil / yerel ayar kodu (ör. İngilizce için "en", Özbekçe için "uz", Japonca (romaji) için "ja-Latn").
    • Olasılık: Bu tahmin için, kayan nokta değeri olarak sıfır ile bir arasında bir olasılık olarak ifade edilen güven puanı.

Yapılandırma seçenekleri

Bu görev aşağıdaki yapılandırma seçeneklerine sahiptir:

Seçenek Adı Açıklama Değer Aralığı Varsayılan Değer
max_results İsteğe bağlı olarak, döndürülecek en yüksek puanlı dil tahmininin maksimum sayısını ayarlar. Bu değer sıfırdan küçükse mevcut tüm sonuçlar döndürülür. Pozitif sayılar -1
score_threshold Model meta verilerinde belirtilen eşiği (varsa) geçersiz kılan tahmin puanı eşiğini ayarlar. Bu değerin altındaki sonuçlar reddedilir. Tüm kayan Belirlenmedi
category_allowlist İzin verilen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse, dil kodu bu grupta yer almayan dil tahminleri filtrelenir. Bu seçenek category_denylist ile birlikte kullanılamaz ve her iki sonucun da kullanılması hataya neden olur. Herhangi bir dize Belirlenmedi
category_denylist İzin verilmeyen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse dil kodu bu kümede yer alan dil tahminleri filtrelenir. Bu seçenek, category_allowlist ile birlikte kullanılamaz ve her iki sonucun da kullanılması hataya neden olur. Herhangi bir dize Belirlenmedi

Modeller

Bu görevle geliştirmeye başladığınızda varsayılan, önerilen bir model sunarız.

Bu model, hafif (315 KB) olacak şekilde tasarlanmıştır ve yerleştirme tabanlı, nöral ağ sınıflandırma mimarisi kullanır. Model, dili ISO 639-1 dil kodu kullanarak tanımlar ve 110 dili tanımlayabilir. Modelin desteklediği dillerin listesi için dilleri ISO 639-1 kodlarına göre listeleyen etiket dosyasına bakın.

Model adı Giriş şekli Nicelleştirme türü Model kartı Sürümler
Dil Algılayıcı dize UTF-8 yok (float32) bilgi En son

Görev karşılaştırmaları

Yukarıda önceden eğitilmiş modellere dayalı olarak ardışık düzenin tamamı için görev karşılaştırmaları aşağıda verilmiştir. Gecikme sonucu, Pixel 6'da CPU / GPU kullanılarak elde edilen ortalama gecikmedir.

Model Adı CPU Gecikmesi GPU Gecikmesi
Dil Algılayıcı 0,31 ms. -