Ti presentiamo LiteRT: il runtime ad alte prestazioni di Google per l'IA on-device, precedentemente noto come TensorFlow Lite.

Questa pagina è stata tradotta dall'API Cloud Translation.

Modelli JAX con LiteRT

Questa pagina fornisce un percorso per gli utenti che desiderano addestrare modelli in JAX ed eseguire il deployment ai dispositivi mobili per l'inferenza. I metodi in questa guida producono un tflite_model che può essere utilizzato direttamente con l'esempio di codice dell'interprete LiteRT o salvato in un tflite file FlatBuffer.

Per un esempio end-to-end, consulta la guida rapida.

Prerequisito

Ti consigliamo di provare questa funzionalità con il nuovo programma Python notturno di TensorFlow pacchetto.

pip install tf-nightly --upgrade

Utilizzeremo lo strumento Orbax Esporta la libreria in esportare modelli JAX. Assicurati che la versione di JAX sia almeno 0.4.20 o successiva.

pip install jax --upgrade
pip install orbax-export --upgrade

Convertire i modelli JAX in LiteRT

Utilizziamo il modello SavedModel di TensorFlow come formato intermedio tra JAX e LiteRT. Dopo aver creato un SavedModel è possibile utilizzare le API LiteRT esistenti per completare il processo di conversione.

# This code snippet converts a JAX model to TFLite through TF SavedModel.
from orbax.export import ExportManager
from orbax.export import JaxModule
from orbax.export import ServingConfig
import tensorflow as tf
import jax.numpy as jnp

def model_fn(_, x):
  return jnp.sin(jnp.cos(x))

jax_module = JaxModule({}, model_fn, input_polymorphic_shape='b, ...')

# Option 1: Simply save the model via `tf.saved_model.save` if no need for pre/post
# processing.
tf.saved_model.save(
    jax_module,
    '/some/directory',
    signatures=jax_module.methods[JaxModule.DEFAULT_METHOD_KEY].get_concrete_function(
        tf.TensorSpec(shape=(None,), dtype=tf.float32, name="input")
    ),
    options=tf.saved_model.SaveOptions(experimental_custom_gradients=True),
)
converter = tf.lite.TFLiteConverter.from_saved_model('/some/directory')
tflite_model = converter.convert()

# Option 2: Define pre/post processing TF functions (e.g. (de)?tokenize).
serving_config = ServingConfig(
    'Serving_default',
    # Corresponds to the input signature of `tf_preprocessor`
    input_signature=[tf.TensorSpec(shape=(None,), dtype=tf.float32, name='input')],
    tf_preprocessor=lambda x: x,
    tf_postprocessor=lambda out: {'output': out}
)
export_mgr = ExportManager(jax_module, [serving_config])
export_mgr.save('/some/directory')
converter = tf.lite.TFLiteConverter.from_saved_model('/some/directory')
tflite_model = converter.convert()

# Option 3: Convert from TF concrete function directly
converter = tf.lite.TFLiteConverter.from_concrete_functions(
    [
        jax_module.methods[JaxModule.DEFAULT_METHOD_KEY].get_concrete_function(
            tf.TensorSpec(shape=(None,), dtype=tf.float32, name="input")
        )
    ]
)
tflite_model = converter.convert()

Controlla il modello TFLite convertito

Dopo che il modello è stato convertito in TFLite, puoi eseguire le API per interpreti TFLite per controllare gli output del modello.

# Run the model with LiteRT
interpreter = tf.lite.Interpreter(model_content=tflite_model)
interpreter.allocate_tensors() input_details = interpreter.get_input_details()
output_details = interpreter.get_output_details()
interpreter.set_tensor(input_details[0]["index"], input_data)
interpreter.invoke()
result = interpreter.get_tensor(output_details[0]["index"])