Integracja klasyfikatora języka naturalnego BERT

Interfejs Task Library BertNLClassifier API jest bardzo podobny do interfejsu NLClassifier klasyfikujący tekst wejściowy do różnych kategorii, z wyjątkiem tego, że ten interfejs API dostosowane do modeli powiązanych z Bertem, które wymagają WordPece i Tokenizacja zdań poza modelem TFLite.

Najważniejsze funkcje interfejsu API BertNLClassifier

  • Jako dane wejściowe pobiera pojedynczy ciąg znaków, klasyfikuje go za pomocą wyniki <label, Score=""> jako wyniki klasyfikacji.</label,>

  • Wykonuje Wordpiece poza wykresem lub Zdanie tokenizacji w tekście wejściowym.

Obsługiwane modele BertNLClassifier

Poniższe modele są zgodne z interfejsem API BertNLClassifier.

Uruchom wnioskowanie w Javie

Krok 1. Zaimportuj zależność Gradle i inne ustawienia

Skopiuj plik modelu .tflite do katalogu zasobów modułu Androida w którym będzie uruchamiany model. Określ, że plik nie powinien być skompresowany. dodaj bibliotekę TensorFlow Lite do pliku build.gradle modułu:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.4.4'
}

Krok 2. Przeprowadź wnioskowanie za pomocą interfejsu API

// Initialization
BertNLClassifierOptions options =
    BertNLClassifierOptions.builder()
        .setBaseOptions(BaseOptions.builder().setNumThreads(4).build())
        .build();
BertNLClassifier classifier =
    BertNLClassifier.createFromFileAndOptions(context, modelFile, options);

// Run inference
List<Category> results = classifier.classify(input);

Zobacz źródło kod .

Uruchom wnioskowanie w Swift

Krok 1. Zaimportuj CocoaPods

Dodaj pod TensorFlowLiteTaskText w pliku Podfile

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.4.4'
end

Krok 2. Przeprowadź wnioskowanie za pomocą interfejsu API

// Initialization
let bertNLClassifier = TFLBertNLClassifier.bertNLClassifier(
      modelPath: bertModelPath)

// Run inference
let categories = bertNLClassifier.classify(text: input)

Zobacz źródło kod .

Uruchom wnioskowanie w C++

// Initialization
BertNLClassifierOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
std::unique_ptr<BertNLClassifier> classifier = BertNLClassifier::CreateFromOptions(options).value();

// Run inference with your input, `input_text`.
std::vector<core::Category> categories = classifier->Classify(input_text);

Zobacz źródło kod .

Uruchom wnioskowanie w Pythonie

Krok 1. Zainstaluj pakiet pip

pip install tflite-support

Krok 2. Korzystanie z modelu

# Imports
from tflite_support.task import text

# Initialization
classifier = text.BertNLClassifier.create_from_file(model_path)

# Run inference
text_classification_result = classifier.classify(text)

Zobacz źródło kod , aby uzyskać więcej opcji konfigurowania BertNLClassifier.

Przykładowe wyniki

Oto przykład wyników klasyfikacji w recenzjach filmów za pomocą funkcji Model MobileBert z Kreatora modeli.

Dane wejściowe: „To urocza i często wciągająca podróż”

Dane wyjściowe:

category[0]: 'negative' : '0.00006'
category[1]: 'positive' : '0.99994'

Wypróbuj proste narzędzie demonstracyjne interfejsu wiersza poleceń dla: BertNLClassifier z własnym modelem i danymi testowymi.

Wymagania dotyczące zgodności z modelem

Interfejs API BetNLClassifier wymaga modelu TFLite z obowiązkowym modelem TFLite Metadane.

Metadane powinny spełniać te wymagania:

  • wejściowe_process_units dla tokenizacji WordPeset/SentencePece

  • 3 tensory wejściowe o nazwach „ids”, „mask” i „segment_ids” dla danych wyjściowych tokenizator

  • 1 tensor wyjściowy typu float32 z opcjonalnie dołączonym plikiem etykiety. Jeśli plik etykiety powinien być zwykłym plikiem tekstowym z jedną etykietą w wierszu, a liczba etykiet powinna być zgodna z liczbą kategorii na wyjściu modelu.