Google AI Edge | Google AI for Developers

Apresentação do Google AI Edge Portal: compare a IA Edge em escala. Inscrição para solicitar acesso durante a visualização particular.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Executar LLMs no dispositivo com o LiteRT-LM

Framework de inferência de código aberto pronto para produção, projetado para oferecer implantações de LLM de alto desempenho e multiplataforma em dispositivos de borda.

Visão geral Começar

Destaque

Turbine a inferência no dispositivo do Gemma 4 com a previsão de vários tokens (MTP, na sigla em inglês). Tenha velocidades de decodificação mais de duas vezes mais rápidas em GPUs móveis sem perda de qualidade.

Postagem do blog Guia

Por que o LiteRT-LM?

Várias plataformas

Implante LLMs no Android, iOS, na Web e em computadores.

Acelerado por hardware

Maximize a performance com a aceleração de GPU e NPU.

Recursos abrangentes de IA generativa

Suporte para LLMs conhecidos, além de multimodalidade (Visão, Áudio) e uso de ferramentas.

Comece a criar

Python

APIs Python com aceleração de hardware no Linux, MacOS, Windows e Raspberry Pi.

Android

Apps Android nativos e ferramentas de computador baseadas em JVM.

Guia do Android

iOS

APIs Swift nativas do iOS (em breve para macOS).

Flutter

Crie apps do Flutter multiplataforma usando o pacote flutter_gemma mantido pela comunidade.

Guia do Flutter

C++

APIs C++ multiplataforma .

Guia de C++

File Builder

Crie arquivos .litertlm com modelos LiteRT convertidos.

Guia do criador de arquivos

Participe da Comunidade

LiteRT-LM no GitHub

Contribua com o projeto de código aberto, informe problemas e confira exemplos.

Hugging face

Baixe modelos pré-convertidos (Gemma, Qwen e muito mais) e participe da discussão.

Ver no Hugging Face

Blogs e anúncios

Leve habilidades agênticas de última geração para a borda com o Gemma 4.

Implante o Gemma 4 no app e em uma variedade maior de dispositivos com desempenho e alcance incríveis usando o LiteRT-LM.

IA generativa no dispositivo no Chrome, Chromebook Plus e Pixel Watch

Implante modelos de linguagem em wearables e plataformas baseadas em navegador usando o LiteRT-LM em grande escala.

Chamada de função no dispositivo na Galeria do Google AI Edge

Saiba como ajustar o FunctionGemma e ativar os recursos de chamada de função com tecnologia das APIs LiteRT-LM Tool Use.

Modelos de linguagem pequenos, multimodalidade e chamada de função da IA do Google Edge

Insights mais recentes sobre RAG, multimodalidade e chamada de função para modelos de linguagem de borda.

Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.

Última atualização 2026-05-18 UTC.