本頁面為想在 JAX 中訓練模型的使用者,提供路徑 到行動裝置進行推論 (Colab 範例)。
本指南中的方法會產生可直接使用的 tflite_model
搭配 TFLite 解譯器程式碼範例,或儲存至 TFLite FlatBuffer 檔案。
修課條件
建議搭配最新 TensorFlow 夜間 Python 來試用這項功能 套件。
pip install tf-nightly --upgrade
我們將使用 Orbax 將程式庫匯出至 就能匯出 JAX 模型確認 JAX 版本至少為 0.4.20 以上版本。
pip install jax --upgrade
pip install orbax-export --upgrade
將 JAX 模型轉換為 LiteRT
我們使用 TensorFlow SavedModel 做為中繼 格式為 JAX 和 LiteRT。有 模組之後 現有的 LiteRT API 可用來完成轉換程序。
# This code snippet converts a JAX model to TFLite through TF SavedModel.
from orbax.export import ExportManager
from orbax.export import JaxModule
from orbax.export import ServingConfig
import tensorflow as tf
import jax.numpy as jnp
def model_fn(_, x):
return jnp.sin(jnp.cos(x))
jax_module = JaxModule({}, model_fn, input_polymorphic_shape='b, ...')
# Option 1: Simply save the model via `tf.saved_model.save` if no need for pre/post
# processing.
tf.saved_model.save(
jax_module,
'/some/directory',
signatures=jax_module.methods[JaxModule.DEFAULT_METHOD_KEY].get_concrete_function(
tf.TensorSpec(shape=(None,), dtype=tf.float32, name="input")
),
options=tf.saved_model.SaveOptions(experimental_custom_gradients=True),
)
converter = tf.lite.TFLiteConverter.from_saved_model('/some/directory')
tflite_model = converter.convert()
# Option 2: Define pre/post processing TF functions (e.g. (de)?tokenize).
serving_config = ServingConfig(
'Serving_default',
# Corresponds to the input signature of `tf_preprocessor`
input_signature=[tf.TensorSpec(shape=(None,), dtype=tf.float32, name='input')],
tf_preprocessor=lambda x: x,
tf_postprocessor=lambda out: {'output': out}
)
export_mgr = ExportManager(jax_module, [serving_config])
export_mgr.save('/some/directory')
converter = tf.lite.TFLiteConverter.from_saved_model('/some/directory')
tflite_model = converter.convert()
# Option 3: Convert from TF concrete function directly
converter = tf.lite.TFLiteConverter.from_concrete_functions(
[
jax_module.methods[JaxModule.DEFAULT_METHOD_KEY].get_concrete_function(
tf.TensorSpec(shape=(None,), dtype=tf.float32, name="input")
)
]
)
tflite_model = converter.convert()
查看轉換後的 TFLite 模型
模型轉換為 TFLite 後,您就能執行 TFLite 解譯器 API, 檢查模型輸出內容
# Run the model with LiteRT
interpreter = tf.lite.Interpreter(model_content=tflite_model)
interpreter.allocate_tensors() input_details = interpreter.get_input_details()
output_details = interpreter.get_output_details()
interpreter.set_tensor(input_details[0]["index"], input_data)
interpreter.invoke()
result = interpreter.get_tensor(output_details[0]["index"])