Es un framework de inferencia de código abierto listo para producción diseñado para ofrecer implementaciones de LLM multiplataforma y de alto rendimiento en dispositivos perimetrales.

Contenido destacado

Consulta nuestro blog más reciente para descubrir cómo LiteRT-LM potencia tus implementaciones de IA generativa integrada en el dispositivo y desbloquea todo el potencial de Gemma 4 con una velocidad increíble y una eficiencia asombrosa gracias a las nuevas APIs de Swift, JavaScript y Flutter.

¿Por qué usar LiteRT-LM?

Implementa LLMs en Android, iOS, la Web y computadoras.
Maximiza el rendimiento con la aceleración de la GPU y la NPU.
Compatibilidad con LLMs populares, así como con multimodalidad (Vision, Audio) y uso de herramientas

Comienza con la compilación

APIs de Python con aceleración de hardware en Linux, macOS, Windows y Raspberry Pi.
Apps nativas para Android y herramientas de escritorio basadas en JVM
APIs de Swift nativas para iOS (próximamente para macOS)
APIs de JavaScript y TypeScript para apps web basadas en el navegador con aceleración de WebGPU.
Compila apps de Flutter multiplataforma con el paquete flutter_gemma que mantiene la comunidad.
APIs de C++ multiplataforma .
Compila archivos .litertlm a partir de modelos de LiteRT convertidos.

Únete a la Comunidad

Contribuye al proyecto de código abierto, informa problemas y consulta ejemplos.
Descarga modelos previamente convertidos (Gemma, Qwen y muchos más) y participa en el debate.

Blogs y anuncios

Experimenta velocidades de decodificación más de 2 veces más rápidas en las GPU para dispositivos móviles sin degradación de la calidad.
Implementa Gemma 4 en la app y en una mayor variedad de dispositivos con un rendimiento y un alcance excepcionales gracias a LiteRT-LM.
Implementa modelos de lenguaje en plataformas basadas en navegadores y wearables a gran escala con LiteRT-LM.
Explora cómo ajustar FunctionGemma y habilitar las capacidades de llamada a funciones con las APIs de LiteRT-LM Tool Use.
Las estadísticas más recientes sobre RAG, multimodalidad y llamada a función para modelos de lenguaje perimetrales.