Python için dil algılama kılavuzu

MediaPipe Dil Dedektörü görevi, bir metin parçasının dilini tanımlamanıza olanak tanır. Bu Dil Dedektörü'nün Python ile nasıl kullanılacağını gösteren talimatlar. Kod örneği bu talimatlarda anlatılanları GitHub'a gidin.

Bu görevi, demo. Özellikler, modeller ve yapılandırma seçenekleri hakkında daha fazla bilgi Bu görev hakkında daha fazla bilgi için Genel Bakış'ı inceleyin.

Kod örneği

Dil Dedektörü örnek kodu, bu dilin tam bir uygulamasını sağlar görevi görebilir. Bu kod, görevi test etmenize ve kendi dil algılama özelliğinizi geliştirmeye başladınız. Bu dosyaları görüntüleyebilir, çalıştırabilir Dil Algılayıcı'yı düzenle örnek kod yalnızca web tarayıcınızı kullanarak.

Kurulum

Bu bölümde, geliştirme ortamınızı ve ayarlarınızı yönetmeyle ilgili ve Dil Dedektörü'nü kullanmak için özel olarak kod projeleri içerir. Şu konularda genel bilgi için: dahil olmak üzere MediaPipe görevlerini kullanmak için geliştirme ortamınızı daha fazla bilgi için Python kurulum kılavuzu.

Paketler

Dil Algılayıcı, mediapipe pip paketini kullanır. Bağımlılığı yükleyebilirsiniz şunlar:

$ python -m pip install mediapipe

İçe aktarılanlar

Dil Dedektörü görev işlevlerine erişmek için aşağıdaki sınıfları içe aktarın:

import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import text

Model

MediaPipe Dil Dedektörü görevi bu görevi görebilir. Dil Dedektörü için eğitilmiş mevcut modeller hakkında daha fazla bilgi için göreve genel bakış Modeller bölümüne.

Modeli seçin ve indirin, ardından proje dizininizde depolayın:

model_path = '/absolute/path/to/language_detector.tflite'

BaseOptions nesnesi model_asset_path ile modelin yolunu belirtin parametresini kullanın:

base_options = BaseOptions(model_asset_path=model_path)

Görevi oluşturma

MediaPipe Dil Dedektörü görevi,create_from_options görevi görebilir. create_from_options işlevi, yapılandırma için değerleri kabul eder seçeneklerini ayarlayın. Görevi şu komutla da başlatabilirsiniz: create_from_model_path fabrika işlevi. create_from_model_path işlevi, eğitilen model dosyasının göreli veya mutlak yolunu kabul eder. Görevleri yapılandırma hakkında daha fazla bilgi edinmek için Yapılandırma seçenekleri.

Aşağıdaki kod, bu görevin nasıl oluşturulacağını ve yapılandırılacağını gösterir.

base_options = python.BaseOptions(model_asset_path=model_path)
options = text.LanguageDetectorOptions(base_options=base_options)

Yapılandırma seçenekleri

Bu görev, Python uygulamaları için aşağıdaki yapılandırma seçeneklerini içerir:

Seçenek Adı Açıklama Değer Aralığı Varsayılan Değer
max_results İsteğe bağlı maksimum puanlı dil tahmini sayısını dön. Bu değer sıfırdan küçükse tüm kullanılabilir sonuçlar döndürülür. Pozitif sayılar -1
score_threshold Şu kriterde sağlanan tahmini geçersiz kılan bir tahmin puanı eşiğini belirler: model meta verileri (varsa). Bu değerin altındaki sonuçlar reddedilir. Herhangi bir kayan nokta Ayarlanmadı
category_allowlist İsteğe bağlı, izin verilen dil kodlarının listesini ayarlar. Boş değilse dil kodu bu kümede olmayan dil tahminleri filtrelendi. Bu seçenek birlikte kullanılamaz category_denylist ve her iki sonucu da kullanmak hataya neden olur. Tüm dizeler Ayarlanmadı
category_denylist İzin verilmeyen dil kodlarının isteğe bağlı listesini ayarlar. Eğer Dil kodu bu kümede bulunan boş olmayan dil tahminleri filtrelenir çıkar. Bu seçenek category_allowlist ve kullanılması bir hatayla sonuçlanır. Tüm dizeler Ayarlanmadı

Verileri hazırlama

Dil Algılayıcı, metin (str) verileriyle çalışır. Görev, veri girişini işler ön işleme dahil edilir. Tümü ön işleme, detect işlevi içinde işlenir. Herhangi bir giriş metninin ek ön işleme tabi tutulmasını sağlar.

input_text = 'The input text to be classified.'

Görevi çalıştırma

Dil Dedektörü, çıkarımları tetiklemek için detect işlevini kullanır. Dil için bu, giriş metni için olası dillerin döndürülmesi anlamına gelir.

Aşağıdaki kod, görevle işlemin nasıl yürütüleceğini gösterir modeli.

with python.text.LanguageDetector.create_from_options(options) as detector:
  detection_result = detector.detect(input_text)

Sonuçları işleme ve görüntüleme

Dil Algılayıcı şu listeden oluşan bir LanguageDetectorResult çıkarır: ve bu tahminlerin olasılıkları. Aşağıda, bu görevdeki çıkış verilerinin bir örneği gösterilmektedir:

LanguageDetectorResult:
  LanguagePrediction #0:
    language_code: "fr"
    probability: 0.999781

Bu sonuç, giriş metninde model çalıştırılarak elde edilmiştir: "Il y a beaucoup de bouches qui parlent et fort peu de têtes qui pensent."

Sonuçları işlemek ve görselleştirmek için gereken kod örneği daha fazla bilgi edinmek için Python örnek uygulaması.