MediaPipe Dil Dedektörü görevi, bir metin parçasının dilini tanımlamanıza olanak tanır. Bu Dil Dedektörü'nün Python ile nasıl kullanılacağını gösteren talimatlar. Kod örneği bu talimatlarda anlatılanları GitHub'a gidin.
Bu görevi, demo. Özellikler, modeller ve yapılandırma seçenekleri hakkında daha fazla bilgi Bu görev hakkında daha fazla bilgi için Genel Bakış'ı inceleyin.
Kod örneği
Dil Dedektörü örnek kodu, bu dilin tam bir uygulamasını sağlar görevi görebilir. Bu kod, görevi test etmenize ve kendi dil algılama özelliğinizi geliştirmeye başladınız. Bu dosyaları görüntüleyebilir, çalıştırabilir Dil Algılayıcı'yı düzenle örnek kod yalnızca web tarayıcınızı kullanarak.
Kurulum
Bu bölümde, geliştirme ortamınızı ve ayarlarınızı yönetmeyle ilgili ve Dil Dedektörü'nü kullanmak için özel olarak kod projeleri içerir. Şu konularda genel bilgi için: dahil olmak üzere MediaPipe görevlerini kullanmak için geliştirme ortamınızı daha fazla bilgi için Python kurulum kılavuzu.
Paketler
Dil Algılayıcı, mediapipe pip paketini kullanır. Bağımlılığı yükleyebilirsiniz şunlar:
$ python -m pip install mediapipe
İçe aktarılanlar
Dil Dedektörü görev işlevlerine erişmek için aşağıdaki sınıfları içe aktarın:
import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import text
Model
MediaPipe Dil Dedektörü görevi bu görevi görebilir. Dil Dedektörü için eğitilmiş mevcut modeller hakkında daha fazla bilgi için göreve genel bakış Modeller bölümüne.
Modeli seçin ve indirin, ardından proje dizininizde depolayın:
model_path = '/absolute/path/to/language_detector.tflite'
BaseOptions
nesnesi model_asset_path
ile modelin yolunu belirtin
parametresini kullanın:
base_options = BaseOptions(model_asset_path=model_path)
Görevi oluşturma
MediaPipe Dil Dedektörü görevi,create_from_options
görevi görebilir. create_from_options
işlevi, yapılandırma için değerleri kabul eder
seçeneklerini ayarlayın. Görevi şu komutla da başlatabilirsiniz:
create_from_model_path
fabrika işlevi. create_from_model_path
işlevi, eğitilen model dosyasının göreli veya mutlak yolunu kabul eder.
Görevleri yapılandırma hakkında daha fazla bilgi edinmek için
Yapılandırma seçenekleri.
Aşağıdaki kod, bu görevin nasıl oluşturulacağını ve yapılandırılacağını gösterir.
base_options = python.BaseOptions(model_asset_path=model_path)
options = text.LanguageDetectorOptions(base_options=base_options)
Yapılandırma seçenekleri
Bu görev, Python uygulamaları için aşağıdaki yapılandırma seçeneklerini içerir:
Seçenek Adı | Açıklama | Değer Aralığı | Varsayılan Değer |
---|---|---|---|
max_results |
İsteğe bağlı maksimum puanlı dil tahmini sayısını dön. Bu değer sıfırdan küçükse tüm kullanılabilir sonuçlar döndürülür. | Pozitif sayılar | -1 |
score_threshold |
Şu kriterde sağlanan tahmini geçersiz kılan bir tahmin puanı eşiğini belirler: model meta verileri (varsa). Bu değerin altındaki sonuçlar reddedilir. | Herhangi bir kayan nokta | Ayarlanmadı |
category_allowlist |
İsteğe bağlı, izin verilen dil kodlarının listesini ayarlar. Boş değilse
dil kodu bu kümede olmayan dil tahminleri
filtrelendi. Bu seçenek birlikte kullanılamaz
category_denylist ve her iki sonucu da kullanmak hataya neden olur. |
Tüm dizeler | Ayarlanmadı |
category_denylist |
İzin verilmeyen dil kodlarının isteğe bağlı listesini ayarlar. Eğer
Dil kodu bu kümede bulunan boş olmayan dil tahminleri filtrelenir
çıkar. Bu seçenek category_allowlist ve
kullanılması bir hatayla sonuçlanır. |
Tüm dizeler | Ayarlanmadı |
Verileri hazırlama
Dil Algılayıcı, metin (str
) verileriyle çalışır. Görev, veri girişini işler
ön işleme dahil edilir. Tümü
ön işleme, detect
işlevi içinde işlenir. Herhangi bir
giriş metninin ek ön işleme tabi tutulmasını sağlar.
input_text = 'The input text to be classified.'
Görevi çalıştırma
Dil Dedektörü, çıkarımları tetiklemek için detect
işlevini kullanır. Dil için
bu, giriş metni için olası dillerin döndürülmesi anlamına gelir.
Aşağıdaki kod, görevle işlemin nasıl yürütüleceğini gösterir modeli.
with python.text.LanguageDetector.create_from_options(options) as detector:
detection_result = detector.detect(input_text)
Sonuçları işleme ve görüntüleme
Dil Algılayıcı şu listeden oluşan bir LanguageDetectorResult
çıkarır:
ve bu tahminlerin olasılıkları.
Aşağıda, bu görevdeki çıkış verilerinin bir örneği gösterilmektedir:
LanguageDetectorResult:
LanguagePrediction #0:
language_code: "fr"
probability: 0.999781
Bu sonuç, giriş metninde model çalıştırılarak elde edilmiştir:
"Il y a beaucoup de bouches qui parlent et fort peu de têtes qui pensent."
Sonuçları işlemek ve görselleştirmek için gereken kod örneği daha fazla bilgi edinmek için Python örnek uygulaması.