LiteRT Next ofron një ndërfaqe të unifikuar për të përdorur Njësitë e Përpunimit Neural (NPU) pa ju detyruar të lundroni individualisht në kompiluesit, kohëzgjatjet ose varësitë e bibliotekës specifike të shitësve. Përdorimi i LiteRT Next për përshpejtimin e NPU shmang shumë komplikime specifike të shitësit ose të pajisjes, rrit performancën për konkluzionet në kohë reale dhe të modeleve të mëdha dhe minimizon kopjet e kujtesës përmes përdorimit të tamponit të harduerit me zero kopje.
Nëse jeni regjistruar tashmë në Programin LiteRT NPU Early Access, regjistrohuni në llogarinë e autorizuar për të parë dokumentacionin e NPU. Nëse nuk jeni regjistruar, regjistrohuni në Programin e Qasjes së Hershme:
Për modelet e gjuhëve të mëdha (LLM) , ne rekomandojmë përdorimin e kuadrit tonë LiteRT-LM për të trajtuar përpunimin e kërkuar nga fundi në fund për ekzekutimin e NPU:
[[["E lehtë për t'u kuptuar","easyToUnderstand","thumb-up"],["E zgjidhi problemin tim","solvedMyProblem","thumb-up"],["Tjetër","otherUp","thumb-up"]],[["Mungojnë informacionet që më nevojiten","missingTheInformationINeed","thumb-down"],["Shumë e ndërlikuar/shumë hapa","tooComplicatedTooManySteps","thumb-down"],["E papërditësuar","outOfDate","thumb-down"],["Problem përkthimi","translationIssue","thumb-down"],["Problem me kampionët/kodin","samplesCodeIssue","thumb-down"],["Tjetër","otherDown","thumb-down"]],["Përditësimi i fundit: 2025-09-03 UTC."],[],[]]