Google AI Edge | Google AI for Developers

Presentamos Google AI Edge Portal: Compara la IA de Edge a gran escala. Regístrate para solicitar acceso durante la vista previa privada.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Ejecuta LLMs en el dispositivo con LiteRT-LM

Es un framework de inferencia de código abierto listo para producción diseñado para ofrecer implementaciones de LLM multiplataforma y de alto rendimiento en dispositivos perimetrales.

Descripción general Comenzar

Contenido destacado

Potencia la inferencia integrado en el dispositivo de Gemma 4 con la predicción de varios tokens (MTP). Experimenta velocidades de decodificación más de 2 veces más rápidas en las GPU para dispositivos móviles sin degradación de la calidad.

Entrada de blog Guía

¿Por qué usar LiteRT-LM?

Plataforma cruzada

Implementa LLMs en Android, iOS, la Web y computadoras.

Acelerado por hardware

Maximiza el rendimiento con la aceleración de la GPU y la NPU.

Amplias capacidades de IA generativa

Compatibilidad con LLMs populares, así como con multimodalidad (Vision, Audio) y uso de herramientas

Comienza con la compilación

Python

APIs de Python con aceleración de hardware en Linux, macOS, Windows y Raspberry Pi.

Guía de Python

Android

Apps nativas para Android y herramientas de escritorio basadas en JVM

Guía de Android

iOS

Integración nativa en iOS y macOS con compatibilidad especializada con Metal (próximamente, habrá APIs de Swift).

Guía de C++

C++

APIs de C++ multiplataforma .

Guía de C++

Únete a la Comunidad

LiteRT-LM en GitHub

Contribuye al proyecto de código abierto, informa problemas y consulta ejemplos.

Hugging Face

Descarga modelos previamente convertidos (Gemma, Qwen y muchos más) y participa en el debate.

Ver en Hugging Face

Blogs y anuncios

Incorpora habilidades de agente de vanguardia al borde con Gemma 4.

Implementa Gemma 4 en la app y en una mayor variedad de dispositivos con un rendimiento y un alcance excepcionales gracias a LiteRT-LM.

IA generativa integrada en Chrome, Chromebook Plus y Pixel Watch

Implementa modelos de lenguaje en plataformas basadas en navegadores y wearables a gran escala con LiteRT-LM.

Llamadas a funciones integradas en el dispositivo en la Galería de Google AI Edge

Explora cómo ajustar FunctionGemma y habilitar las capacidades de llamada a funciones con las APIs de LiteRT-LM Tool Use.

Modelos de lenguaje pequeños, multimodalidad y llamadas a funciones de Google AI Edge

Las estadísticas más recientes sobre RAG, multimodalidad y llamada a función para modelos de lenguaje perimetrales.

Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.

Última actualización: 2026-05-05 (UTC)