LiteRT-LM으로 기기 내에서 LLM 실행
에지 기기에서 고성능 크로스 플랫폼 LLM 배포를 제공하도록 설계된 프로덕션 지원 오픈소스 추론 프레임워크입니다.
LiteRT-LM을 사용해야 하는 이유
교차 플랫폼
Android, iOS, 웹, 데스크톱에 LLM을 배포합니다.
하드웨어 가속
GPU 및 NPU 가속으로 성능을 극대화하세요.
광범위한 생성형 AI 기능
인기 있는 LLM과 멀티모달리티 (비전, 오디오), 도구 사용 지원
빌드 시작
Python
Linux, MacOS, Windows, Raspberry Pi에서 하드웨어 가속을 사용하는 Python API
Android
네이티브 Android 앱 및 JVM 기반 데스크톱 도구
iOS
네이티브 iOS (macOS 지원 예정) Swift API
Web
WebGPU 가속을 사용하는 브라우저 기반 웹 앱을 위한 JavaScript 및 TypeScript API입니다.
Flutter
커뮤니티에서 유지관리하는 flutter_gemma 패키지를 사용하여 크로스 플랫폼 Flutter 앱을 빌드합니다.
C++
크로스 플랫폼 C++ API
File Builder
변환된 LiteRT 모델에서 .litertlm 파일을 빌드합니다.
커뮤니티 참여
GitHub의 LiteRT-LM
오픈소스 프로젝트에 참여하고, 문제를 신고하고, 예시를 확인하세요.
Hugging Face
사전 변환된 모델 (Gemma, Qwen 등)을 다운로드하고 토론에 참여하세요.
블로그 및 공지사항
Gemma 4로 최첨단 에이전트 기술을 에지에 적용하세요.
LiteRT-LM을 사용하여 뛰어난 성능과 도달범위를 갖춘 Gemma 4를 인앱 및 다양한 기기에 배포하세요.
Chrome, Chromebook Plus, Pixel Watch의 온디바이스 생성형 AI
LiteRT-LM을 사용하여 웨어러블 및 브라우저 기반 플랫폼에 언어 모델을 대규모로 배포합니다.
Google AI Edge 갤러리의 온디바이스 함수 호출
FunctionGemma를 미세 조정하고 LiteRT-LM 도구 사용 API로 구동되는 함수 호출 기능을 사용 설정하는 방법을 알아봅니다.
Google AI Edge 소형 언어 모델, 멀티모달리티, 함수 호출
에지 언어 모델의 RAG, 멀티모달, 함수 호출에 관한 최신 통계