LiteRT Next fornisce un'interfaccia unificata per utilizzare le unità di elaborazione neurali (NPU)
senza costringerti a navigare individualmente tra compilatori, runtime o dipendenze di librerie specifici del fornitore. L'utilizzo di LiteRT Next per l'accelerazione della NPU evita
molte complicazioni specifiche del fornitore o del dispositivo, aumenta le prestazioni per
l'inferenza in tempo reale e di modelli di grandi dimensioni e riduce al minimo le copie della memoria tramite
l'utilizzo di buffer hardware senza copia.
Se hai già eseguito la registrazione al programma di accesso in anteprima alla NPU LiteRT, accedi
all'account autorizzato per visualizzare la documentazione della NPU. Se non hai effettuato la registrazione,
iscriviti al programma di accesso in anteprima:
Per i modelli linguistici di grandi dimensioni (LLM), consigliamo di utilizzare il nostro framework
LiteRT-LM per gestire
l'elaborazione end-to-end richiesta per l'esecuzione della NPU:
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-03 UTC."],[],[]]