LiteRT-LM を使用してオンデバイスで LLM を実行する
エッジ デバイスで高性能なクロスプラットフォーム LLM デプロイを実現するように設計された、本番環境対応のオープンソース推論フレームワーク。
LiteRT-LM を選ぶ理由
クロス プラットフォーム
Android、iOS、ウェブ、パソコンに LLM をデプロイします。
ハードウェア アクセラレーション
GPU と NPU のアクセラレーションでパフォーマンスを最大化します。
幅広い生成 AI 機能
一般的な LLM のほか、マルチモーダル(Vision、Audio)とツール使用のサポート。
構築を開始
Python
Linux、MacOS、Windows、Raspberry Pi でハードウェア アクセラレーションを使用する Python API。
Android
ネイティブ Android アプリと JVM ベースのデスクトップ ツール。
iOS
ネイティブ iOS(macOS は近日提供予定)Swift API。
Web
WebGPU アクセラレーションを使用したブラウザベースのウェブアプリ用の JavaScript API と TypeScript API。
Flutter
コミュニティで管理されている flutter_gemma パッケージを使用して、クロスプラットフォームの Flutter アプリを構築します。
C++
クロス プラットフォーム C++ API。
ファイル ビルダー
変換された LiteRT モデルから .litertlm ファイルをビルドします。
コミュニティに参加
GitHub の LiteRT-LM
オープンソース プロジェクトに貢献し、問題を報告して、例を確認します。
Hugging Face
変換済みのモデル(Gemma、Qwen など)をダウンロードして、ディスカッションに参加してください。
ブログとお知らせ
Gemma 4 で最先端のエージェント スキルをエッジに導入します。
LiteRT-LM を使用して、アプリ内や幅広いデバイスに Gemma 4 をデプロイし、優れたパフォーマンスとリーチを実現します。
Chrome、Chromebook Plus、Google Pixel Watch のオンデバイス生成 AI
LiteRT-LM を使用して、ウェアラブルやブラウザベースのプラットフォームに言語モデルを大規模にデプロイします。
Google AI Edge ギャラリーのオンデバイス関数呼び出し
FunctionGemma をファインチューニングし、LiteRT-LM Tool Use API を活用した関数呼び出し機能を有効にする方法について説明します。
Google AI Edge の小規模言語モデル、マルチモーダル、関数呼び出し
エッジ言語モデルの RAG、マルチモダリティ、関数呼び出しに関する最新の分析情報。