Ngoài API gốc, bạn cũng có thể truy cập LiteRT trong Dịch vụ Google Play bằng API Java. Cụ thể, LiteRT trong các dịch vụ của Google Play có sẵn thông qua API Trình diễn giải LiteRT.
Sử dụng API Trình thông dịch
API Trình diễn giải LiteRT do môi trường thời gian chạy TensorFlow cung cấp, cung cấp một giao diện dùng cho nhiều mục đích để tạo và chạy mô hình học máy. Sử dụng các bước sau để chạy suy luận với API Thông dịch viên bằng TensorFlow Thu gọn trong thời gian chạy của Dịch vụ Google Play.
1. Thêm phần phụ thuộc của dự án
Thêm các phần phụ thuộc sau vào mã dự án ứng dụng để truy cập API Dịch vụ Play cho LiteRT:
dependencies {
...
// LiteRT dependencies for Google Play services
implementation 'com.google.android.gms:play-services-tflite-java:16.0.1'
// Optional: include LiteRT Support Library
implementation 'com.google.android.gms:play-services-tflite-support:16.0.1'
...
}
2. Thêm quá trình khởi chạy LiteRT
Khởi chạy thành phần LiteRT của API Dịch vụ Google Play trước khi sử dụng các API LiteRT:
Kotlin
val initializeTask: Task<Void> by lazy { TfLite.initialize(this) }
Java
Task<Void> initializeTask = TfLite.initialize(context);
3. Tạo Trình diễn giải và đặt tuỳ chọn thời gian chạy
Tạo trình phiên dịch bằng InterpreterApi.create()
và định cấu hình trình phiên dịch để sử dụng
Thời gian chạy của Dịch vụ Google Play, bằng cách gọi InterpreterApi.Options.setRuntime()
,
như trong đoạn mã ví dụ sau:
Kotlin
import org.tensorflow.lite.InterpreterApi import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime ... private lateinit var interpreter: InterpreterApi ... initializeTask.addOnSuccessListener { val interpreterOption = InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) interpreter = InterpreterApi.create( modelBuffer, interpreterOption )} .addOnFailureListener { e -> Log.e("Interpreter", "Cannot initialize interpreter", e) }
Java
import org.tensorflow.lite.InterpreterApi import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime ... private InterpreterApi interpreter; ... initializeTask.addOnSuccessListener(a -> { interpreter = InterpreterApi.create(modelBuffer, new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)); }) .addOnFailureListener(e -> { Log.e("Interpreter", String.format("Cannot initialize interpreter: %s", e.getMessage())); });
Bạn nên sử dụng phương thức triển khai ở trên vì phương thức này giúp tránh chặn luồng giao diện người dùng Android. Nếu cần quản lý việc thực thi luồng chặt chẽ hơn, bạn
có thể thêm lệnh gọi Tasks.await()
vào quy trình tạo phiên dịch:
Kotlin
import androidx.lifecycle.lifecycleScope ... lifecycleScope.launchWhenStarted { // uses coroutine initializeTask.await() }
Java
@BackgroundThread InterpreterApi initializeInterpreter() { Tasks.await(initializeTask); return InterpreterApi.create(...); }
4. Chạy suy luận
Sử dụng đối tượng interpreter
mà bạn đã tạo, gọi phương thức run()
để tạo
một suy luận.
Kotlin
interpreter.run(inputBuffer, outputBuffer)
Java
interpreter.run(inputBuffer, outputBuffer);
Tăng tốc phần cứng
LiteRT cho phép bạn tăng tốc hiệu suất của mô hình bằng cách sử dụng các bộ xử lý phần cứng chuyên dụng, chẳng hạn như đơn vị xử lý đồ hoạ (GPU). Bạn có thể tận dụng các bộ xử lý chuyên dụng này bằng cách sử dụng các trình điều khiển phần cứng được gọi là uỷ quyền.
Đại diện GPU được cung cấp thông qua Dịch vụ Google Play và được tải động, giống như các phiên bản Dịch vụ Play của API Trình diễn giải.
Đang kiểm tra khả năng tương thích của thiết bị
Không phải thiết bị nào cũng hỗ trợ tăng tốc phần cứng GPU bằng TFLite. Để
giảm thiểu lỗi và sự cố tiềm ẩn, hãy sử dụng
Phương thức TfLiteGpu.isGpuDelegateAvailable
để kiểm tra xem một thiết bị có
tương thích với uỷ quyền GPU.
Sử dụng phương thức này để xác nhận xem thiết bị có tương thích với GPU hay không và sử dụng CPU làm phương án dự phòng khi GPU không được hỗ trợ.
useGpuTask = TfLiteGpu.isGpuDelegateAvailable(context)
Sau khi có một biến như useGpuTask
, bạn có thể sử dụng biến đó để xác định xem thiết bị có sử dụng trình uỷ quyền GPU hay không.
Kotlin
val interpreterTask = useGpuTask.continueWith { task -> val interpreterOptions = InterpreterApi.Options() .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) if (task.result) { interpreterOptions.addDelegateFactory(GpuDelegateFactory()) } InterpreterApi.create(FileUtil.loadMappedFile(context, MODEL_PATH), interpreterOptions) }
Java
Task<InterpreterApi.Options> interpreterOptionsTask = useGpuTask.continueWith({ task -> InterpreterApi.Options options = new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY); if (task.getResult()) { options.addDelegateFactory(new GpuDelegateFactory()); } return options; });
GPU có API Trình diễn giải
Cách sử dụng trình uỷ quyền GPU với API Trình diễn giải:
Cập nhật các phần phụ thuộc của dự án để sử dụng trình uỷ quyền GPU từ Dịch vụ Play:
implementation 'com.google.android.gms:play-services-tflite-gpu:16.1.0'
Bật tuỳ chọn uỷ quyền GPU trong quá trình khởi chạy TFlite:
Kotlin
TfLite.initialize(context, TfLiteInitializationOptions.builder() .setEnableGpuDelegateSupport(true) .build())
Java
TfLite.initialize(context, TfLiteInitializationOptions.builder() .setEnableGpuDelegateSupport(true) .build());
Bật tính năng uỷ quyền GPU trong các tuỳ chọn trình thông dịch: đặt nhà máy uỷ quyền thành GpuDelegateFactory bằng cách gọi
addDelegateFactory() within
InterpreterApi.Options()`:Kotlin
val interpreterOption = InterpreterApi.Options() .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) .addDelegateFactory(GpuDelegateFactory())
Java
Options interpreterOption = InterpreterApi.Options() .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) .addDelegateFactory(new GpuDelegateFactory());
Di chuyển từ LiteRT độc lập
Nếu bạn dự định di chuyển ứng dụng của mình từ LiteRT độc lập sang API Dịch vụ Play, hãy tham khảo hướng dẫn bổ sung sau đây để cập nhật mã dự án ứng dụng:
- Xem lại phần Hạn chế của trang này để đảm bảo có hỗ trợ trường hợp sử dụng.
- Trước khi cập nhật mã, hãy kiểm tra hiệu suất và độ chính xác cho các mô hình phân bổ, đặc biệt nếu bạn sử dụng các phiên bản LiteRT trước đó phiên bản 2.1, nên bạn có cơ sở để so sánh với trong quá trình triển khai.
- Nếu bạn đã di chuyển tất cả mã để sử dụng API Dịch vụ Play cho
LiteRT, bạn nên xoá thời gian chạy LiteRT hiện có
thư viện (mục nhập có
org.tensorflow:tensorflow-lite:*
) qua tệp build.gradle của bạn để bạn có thể giảm kích thước ứng dụng. - Xác định tất cả các lần tạo đối tượng
new Interpreter
trong mã của bạn, và sửa đổi từng mã để nó sử dụng lệnh gọi thẳng Api.create(). Chiến lược phát hành đĩa đơn new TfLite.initialize không đồng bộ, nghĩa là trong hầu hết các trường hợp nó không phải là thay thế thả xuống: bạn phải đăng ký trình nghe khi lệnh gọi hoàn tất. Tham khảo đoạn mã trong mã Bước 3. - Thêm
import org.tensorflow.lite.InterpreterApi;
vàimport org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime;
vào bất kỳ nguồn nào bằng cách sử dụngorg.tensorflow.lite.Interpreter
hoặcorg.tensorflow.lite.InterpreterApi
. - Nếu bất kỳ lệnh gọi nào đến
InterpreterApi.create()
chỉ có một đối số, hãy thêmnew InterpreterApi.Options()
vào danh sách đối số. - Thêm
.setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
vào đối số cuối cùng của bất kỳ lệnh gọi nào đếnInterpreterApi.create()
. - Thay thế tất cả các lần xuất hiện khác của lớp
org.tensorflow.lite.Interpreter
bằngorg.tensorflow.lite.InterpreterApi
.
Nếu bạn muốn sử dụng LiteRT độc lập và API Dịch vụ Play song song, bạn phải sử dụng LiteRT 2.9 (trở lên). LiteRT 2.8 trở về trước không tương thích với phiên bản API Dịch vụ Play.