LiteRT per Android

Le seguenti API di runtime LiteRT sono disponibili per lo sviluppo di Android:

  • API CompiledModel: lo standard moderno per l'inferenza ad alte prestazioni, che semplifica l'accelerazione hardware su CPU/GPU/NPU. Scopri di più su perché scegliere l'API CompiledModel.
  • API Interpreter: l'API di inferenza di base, gestita per la compatibilità con le versioni precedenti.

Inizia a utilizzare l'API CompiledModel

Versioni e API Android supportate

Versione di LiteRT Stato API supportata Livello SDK minimo Versione NDK minima (se utilizzata) Data di uscita
v2.1.4 ✅ Più recente CompiledModel
Interpreter(solo CPU)
23 (Android 6 Marshmallow) r26a 2026-04-10
v2.1.3 ⚠️ Precedente CompiledModel
Interpreter(solo CPU)
23 (Android 6 Marshmallow) r26a 2026-03-16
v2.1.1 ⚠️ Precedente CompiledModel
Interpreter(solo CPU)
23 (Android 6 Marshmallow) r26a 2026-01-27
v2.1.0 ⚠️ Precedente CompiledModel
Interpreter(solo CPU)
23 (Android 6 Marshmallow) r26a 2025-12-19
v2.0.3 ⚠️ Precedente CompiledModel 26 (Android 8 Oreo) r26a 2025-11-08
v1.4.2 ✅ Più recente Interpreter 21 (Android 5 Lollipop) r26a 2026-03-16
v1.4.1 ⚠️ Precedente Interpreter 21 (Android 5 Lollipop) r26a 2025-11-07
v1.4.0 ⚠️ Precedente Interpreter 26 (Android 8 Oreo) r26a 2025-06-25
v1.3.0 ⚠️ Precedente Interpreter 21 (Android 5 Lollipop) r26a 2025-05-19
v1.2.0 ⚠️ Precedente Interpreter 21 (Android 5 Lollipop) r26a 2025-03-13

Importante: mantieni aggiornate le dipendenze per garantire la compatibilità con le funzionalità e gli aggiornamenti di sicurezza più recenti.

Guida rapida all'utilizzo dell'API CompiledModel

Aggiungi il pacchetto Maven LiteRT al tuo progetto Android:

dependencies {
  ...
  implementation `com.google.ai.edge.litert:litert:2.1.0`
}

Integra il modello .tflite con l'API CompiledModel. Il seguente snippet di codice mostra l'implementazione di base in Kotlin e C++.

Kotlin

// Load model and initialize runtime
val compiledModel = CompiledModel.create(
    "/path/to/mymodel.tflite",
    CompiledModel.Options(Accelerator.CPU))

// Preallocate input/output buffers
val inputBuffers = compiledModel.createInputBuffers()
val outputBuffers = compiledModel.createOutputBuffers()

// Fill the input buffer
inputBuffers.get(0).writeFloat(input0)
inputBuffers.get(1).writeFloat(input1)

// Invoke
compiledModel.run(inputBuffers, outputBuffers)

// Read the output
val output = outputBuffers.get(0).readFloat()

C++

// Load model and initialize runtime
LITERT_ASSIGN_OR_RETURN(auto env, GetEnvironment());
LITERT_ASSIGN_OR_RETURN(auto options, GetOptions());
LITERT_ASSIGN_OR_RETURN(
    auto compiled_model,
    CompiledModel::Create(env, "/path/to/mymodel.tflite", options));

// Preallocate input/output buffers
LITERT_ASSIGN_OR_RETURN(auto input_buffers,compiled_model.CreateInputBuffers(signature_index));
LITERT_ASSIGN_OR_RETURN(auto output_buffers,compiled_model.CreateOutputBuffers(signature_index));

// Fill the input buffer
LITERT_ABORT_IF_ERROR(input_buffers[0].Write(input0));
LITERT_ABORT_IF_ERROR(input_buffers[1].Write(input1));

// Invoke
LITERT_ABORT_IF_ERROR(compiled_model.Run(signature_index, input_buffers, output_buffers));

// Read the output
LITERT_ABORT_IF_ERROR(output_buffers[0].Read(output0));