Tugas Pengklasifikasi Teks memungkinkan Anda mengklasifikasi teks ke dalam serangkaian kategori yang ditentukan, seperti sentimen positif atau negatif. Kategori ditentukan berdasarkan model yang Anda gunakan dan cara model tersebut dilatih. Petunjuk ini menunjukkan cara menggunakan {i>Text Classifier<i} di aplikasi iOS. Contoh kode yang dijelaskan dalam petunjuk tersedia di GitHub.
Anda dapat melihat cara kerja tugas ini dengan membuka Web demo. Sebagai informasi lebih lanjut tentang kemampuan, model, dan opsi konfigurasi dari untuk tugas ini, lihat Ringkasan.
Contoh kode
Kode contoh Tugas MediaPipe adalah implementasi dasar dari Pengklasifikasi Teks untuk iOS.
Anda dapat menggunakan aplikasi ini sebagai titik awal untuk aplikasi iOS Anda sendiri, atau merujuk ke sana saat memodifikasi aplikasi yang ada. Anda dapat melihat kode contoh Pengklasifikasi Teks nyala GitHub.
Mendownload kode
Petunjuk berikut menunjukkan cara membuat salinan lokal dari contoh kode menggunakan alat command line git.
Untuk mendownload kode contoh:
Clone repositori git menggunakan perintah berikut:
git clone https://github.com/google-ai-edge/mediapipe-samples
Secara opsional, konfigurasikan instance git Anda untuk menggunakan checkout sparse, sehingga Anda memiliki hanya file untuk aplikasi contoh Text Classifier:
cd mediapipe git sparse-checkout init --cone git sparse-checkout set examples/text_classification/ios/
Setelah membuat versi lokal dari kode contoh, Anda dapat menginstal Library tugas MediaPipe, buka project menggunakan Xcode, lalu jalankan aplikasi. Sebagai lihat Panduan Penyiapan untuk iOS.
Komponen utama
File berikut berisi kode penting untuk contoh Pengklasifikasi Teks aplikasi:
- TextClassifierHelper.swift: Melakukan inisialisasi pengklasifikasi teks dan menangani pemilihan model.
- ViewController.swift: Mengimplementasikan UI dan memformat hasilnya.
Penyiapan
Bagian ini menjelaskan langkah-langkah utama untuk menyiapkan lingkungan pengembangan dan kode project untuk menggunakan Text Classifier. Untuk informasi umum tentang penyiapan lingkungan pengembangan untuk menggunakan tugas MediaPipe, termasuk versi platform persyaratan, lihat Panduan penyiapan untuk iOS.
Dependensi
Text Classifier menggunakan library MediaPipeTasksText
, yang harus diinstal
menggunakan CocoaPods. Library ini kompatibel dengan aplikasi Swift dan Objective-C
dan tidak memerlukan penyiapan tambahan khusus bahasa.
Untuk petunjuk menginstal CocoaPods di macOS, lihat CocoaPods
panduan pemasangan kami.
Untuk mendapatkan petunjuk cara membuat Podfile
dengan pod yang diperlukan untuk
aplikasi, lihat Menggunakan
CocoaPods.
Tambahkan pod MediaPipeTasksText di Podfile
menggunakan kode berikut:
target 'MyTextClassifierApp' do
use_frameworks!
pod 'MediaPipeTasksText'
end
Jika aplikasi Anda menyertakan target pengujian unit, lihat Panduan Penyiapan untuk
iOS untuk informasi tambahan terkait penyiapan
Podfile
Anda.
Model
Tugas MediaPipe Text Classifier memerlukan model terlatih yang kompatibel dengan tugas ini. Untuk informasi lebih lanjut tentang model terlatih yang tersedia Text Classifier, lihat ringkasan tugas Models bagian.
Pilih dan download model, lalu tambahkan ke direktori project Anda menggunakan Xcode. Untuk instruksi tentang cara menambahkan file ke proyek Xcode Anda, lihat Mengelola dan folder di Xcode Anda project Anda.
Gunakan properti BaseOptions.modelAssetPath
untuk menentukan jalur ke model
dalam app bundle Anda. Untuk contoh kode, lihat bagian berikutnya.
Membuat tugas
Anda dapat membuat tugas Pengklasifikasi Teks dengan memanggil salah satu penginisialisasinya. Tujuan
Penginisialisasi TextClassifier(options:)
menetapkan nilai untuk konfigurasi
lainnya.
Jika Anda tidak memerlukan Pengklasifikasi Teks yang diinisialisasi dengan konfigurasi yang disesuaikan
Anda dapat menggunakan penginisialisasi TextClassifier(modelPath:)
untuk membuat
Pengklasifikasi Teks dengan opsi default. Untuk informasi selengkapnya tentang konfigurasi
opsi, lihat Ringkasan Konfigurasi.
Kode berikut menunjukkan cara membangun dan mengonfigurasi tugas ini.
Swift
import MediaPipeTasksText
let modelPath = Bundle.main.path(forResource: "model",
ofType: "tflite")
let options = TextClassifierOptions()
options.baseOptions.modelAssetPath = modelPath
options.scoreThreshold = 0.6
let textClassifier = try TextClassifier(options: options)
Objective-C
@import MediaPipeTasksText;
NSString *modelPath = [[NSBundle mainBundle] pathForResource:@"model"
ofType:@"tflite"];
MPPTextClassifierOptions *options = [[MPPTextClassifierOptions alloc] init];
options.baseOptions.modelAssetPath = modelPath;
options.scoreThreshold = 0.6;
MPPTextClassifier *textClassifier =
[[MPPTextClassifier alloc] initWithOptions:options error:nil];
Opsi konfigurasi
Tugas ini memiliki opsi konfigurasi berikut untuk aplikasi iOS:
Nama Opsi | Deskripsi | Rentang Nilai | Nilai Default |
---|---|---|---|
displayNamesLocale |
Menyetel bahasa label yang akan digunakan untuk nama tampilan yang diberikan di
metadata model tugas, jika tersedia. Defaultnya adalah en untuk
Bahasa Inggris. Anda dapat menambahkan label yang dilokalkan ke metadata model kustom
menggunakan TensorFlow Lite Metadata Writer API
| Kode lokal | id |
maxResults |
Menetapkan jumlah maksimum opsional untuk hasil klasifikasi dengan skor tertinggi ke kembali. Jika < 0, semua hasil yang tersedia akan ditampilkan. | Semua angka positif | -1 |
scoreThreshold |
Menetapkan ambang batas skor prediksi yang menggantikan skor yang diberikan dalam metadata model (jika ada). Hasil di bawah nilai ini ditolak. | Float mana pun | Tidak ditetapkan |
categoryAllowlist |
Menetapkan daftar opsional untuk nama kategori yang diizinkan. Jika tidak kosong,
hasil klasifikasi yang nama kategorinya tidak ada dalam kumpulan ini akan
disaring. Nama kategori duplikat atau yang tidak diketahui akan diabaikan.
Opsi ini saling eksklusif dengan categoryDenylist dan menggunakan
keduanya akan menghasilkan {i>error<i}. |
String apa pun | Tidak ditetapkan |
categoryDenylist |
Menetapkan daftar opsional nama kategori yang tidak diizinkan. Jika
hasil klasifikasi yang tidak kosong, yang nama kategorinya dalam rangkaian ini akan difilter
posisi-posisi ini. Nama kategori duplikat atau yang tidak diketahui akan diabaikan. Opsi ini sama-sama
eksklusif dengan categoryAllowlist dan menggunakan keduanya akan menyebabkan error. |
String apa pun | Tidak ditetapkan |
Menyiapkan data
Text Classifier berfungsi dengan data teks. Tugas ini menangani input data pra-pemrosesan, termasuk tokenisasi dan pra-pemrosesan tensor.
Semua pra-pemrosesan ditangani dalam fungsi classify(text:)
. Tidak ada
perlu pra-pemrosesan tambahan terhadap teks input itu.
Swift
let text = "The input text to be classified."
Objective-C
NSString *text = @"The input text to be classified.";
Menjalankan tugas
Untuk menjalankan Pengklasifikasi Teks, gunakan metode classify(text:)
. Pengklasifikasi Teks
mengembalikan kategori yang memungkinkan untuk teks input.
Swift
let result = try textClassifier.classify(text: text)
Objective-C
MPPTextClassifierResult *result = [textClassifier classifyText:text
error:nil];
Catatan: Tugas memblokir thread saat ini hingga selesai menjalankan inferensi pada teks. Untuk menghindari pemblokiran thread saat ini, jalankan pemrosesan dalam thread latar belakang menggunakan iOS Dispatch atau NSOperation framework.
Menangani dan menampilkan hasil
Setelah menjalankan inferensi, tugas Pengklasifikasi Teks akan menampilkan TextClassifierResult
yang berisi daftar kategori yang memungkinkan untuk teks input. Tujuan
kategori ditentukan oleh model yang Anda gunakan, jadi jika Anda ingin
kategori, memilih model lain, atau melatih ulang model yang sudah ada.
Berikut ini contoh data output dari tugas ini:
TextClassificationResult:
Classification #0 (single classification head):
ClassificationEntry #0:
Category #0:
category name: "positive"
score: 0.8904
index: 0
Category #1:
category name: "negative"
score: 0.1096
index: 1
Hasil ini diperoleh dengan menjalankan pengklasifikasi BERT pada teks input:
"an imperfect but overall entertaining mystery"
.
Tujuan ViewController.swift dalam kode contoh menunjukkan cara menampilkan hasil deteksi ditampilkan dari tugas.