Dil algılama kılavuzu

Fransızca bir giriş cümlesini gösteren ve çıkışta Fransızca olarak doğru şekilde tanımlanan örnek kullanıcı arayüzü.

MediaPipe Dil Algılayıcı görevi, bir metnin dilini belirlemenize olanak tanır. Bu görev, makine öğrenimi (ML) modeli ile metin verilerinde çalışır ve her biri bir ISO 639-1 dil kodundan ve olasılıktan oluşan bir tahmin listesi döndürür.

Deneyin.

Başlayın

Hedef platformunuzla ilgili bu uygulama kılavuzlarından birini uygulayarak bu görevi kullanmaya başlayın. Platforma özel bu kılavuzlar, önerilen bir model ve önerilen yapılandırma seçenekleriyle birlikte kod örneği de dahil olmak üzere bu görevin temel uygulama sürecinde size yol gösterir:

Görev ayrıntıları

Bu bölümde, bu görevin özellikleri, girişleri, çıkışları ve yapılandırma seçenekleri açıklanmaktadır.

Özellikler

  • Puan eşiği: Sonuçları tahmin puanlarına göre filtreleyin
  • İzin verilenler ve reddedilenler etiket listesi: Tespit edilen kategorileri belirtin.
Görev girişleri Görev çıkışları
Dil Tanımlayıcı, aşağıdaki giriş veri türünü kabul eder:
  • Dize
Dil algılayıcı, aşağıdakileri içeren bir tahmin listesi döndürür:
    • Dil kodu: ISO 639-1 (https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes) dil / yer kodu (ör. İngilizce için "en", Özbekçe için "uz", Japonca (romaji) için "ja-Latn") dizesi.
    • Olasılık: Bu tahminin güven puanı. Kayan nokta değeri olarak sıfır ile bir arasında bir olasılık olarak ifade edilir.

Yapılandırma seçenekleri

Bu görev için aşağıdaki yapılandırma seçenekleri vardır:

Seçenek Adı Açıklama Değer Aralığı Varsayılan değer
max_results Döndürülecek isteğe bağlı maksimum sayıdaki en yüksek puan alan dil tahminlerini ayarlar. Bu değer sıfırdan azsa mevcut tüm sonuçlar döndürülür. Tüm pozitif sayılar -1
score_threshold Model meta verilerinde (varsa) sağlanan eşiği geçersiz kılan tahmin puanı eşiğini belirler. Bu değerin altındaki sonuçlar reddedilir. Herhangi bir kayan nokta Ayarlanmadı
category_allowlist İzin verilen dil kodlarının isteğe bağlı listesini ayarlar. Boş değilse dil kodu bu kümede olmayan dil tahminleri filtrelenir. Bu seçenek, category_denylist ile birbirini hariç tutar ve her ikisinin de kullanılması hatayla sonuçlanır. Herhangi bir dize Ayarlanmadı
category_denylist İzin verilmeyen dil kodlarının isteğe bağlı listesini belirler. Boş değilse dil kodu bu kümede olan dil tahminleri filtrelenir. Bu seçenek, category_allowlist ile birbirini hariç tutar ve her ikisinin de kullanılması hatayla sonuçlanır. Herhangi bir dize Ayarlanmadı

Modeller

Bu görevle geliştirmeye başladığınızda varsayılan olarak önerilen bir model sunarız.

Bu model, hafif (315 KB) olacak şekilde tasarlanmıştır ve yerleştirme tabanlı, sinir ağı sınıflandırma mimarisi kullanır. Model, ISO 639-1 dil kodunu kullanarak dili tanımlar ve 110 dili tanımlayabilir. Modelin desteklediği dillerin listesi için dilleri ISO 639-1 kodlarına göre listeleyen etiket dosyasına bakın.

Model adı Giriş şekli Kesirli sayılaştırma türü Model kartı Sürümler
Dil Algılayıcı dize UTF-8 yok (float32) info En son

Görev karşılaştırmaları

Yukarıdaki önceden eğitilmiş modellere dayalı olarak tüm ardışık düzenin görev karşılaştırmalarını aşağıda bulabilirsiniz. Gecikme sonucu, CPU / GPU kullanan Pixel 6'taki ortalama gecikmedir.

Model Adı CPU Gecikmesi GPU Gecikmesi
Dil algılama 0,31 ms -