Google AI Edge Portal のご紹介: エッジ AI を大規模にベンチマークします。限定公開プレビュー中にアクセスをリクエストするには、登録してください。

このページは Cloud Translation API によって翻訳されました。

LiteRT を使用して生成 AI モデルをデプロイする

LiteRT は、モバイル、デスクトップ、ウェブプラットフォーム全体で生成 AI モデルの高性能なデプロイを実現します。LiteRT は、CPU、GPU、NPU のハードウェアアクセラレーションをシームレスに活用することで、オンデバイスの GenAI 推論に最先端のパフォーマンスを提供します。

次の統合型テクノロジスタックを使用して、複雑な GenAI モデルをデプロイできます。

Torch Generative API: PyTorch GenAI モデルの作成と変換を行うための AI Edge Torch ライブラリ内の Python モジュール。デバイスでの高性能な実行を保証する最適化されたビルディングブロックを提供します。詳細については、PyTorch GenAI モデルを変換するをご覧ください。
LiteRT-LM: LiteRT の上に構築された専用のオーケストレーションレイヤ。セッションのクローニング、kv-cache 管理、プロンプトのキャッシュ保存/スコアリング、ステートフル推論など、LLM 固有の複雑さを管理します。詳細については、LiteRT-LM GitHub リポジトリをご覧ください。
LiteRT Converter と Runtime: 効率的なモデル変換、ランタイム実行、最適化を実現する基盤となるエンジン。CPU、GPU、NPU 全体で高度なハードウェアアクセラレーションを可能にします。

LiteRT GenAI モデル動物園

LiteRT は、LiteRT Hugging Face コミュニティで、人気のあるオープンウェイトモデルのコレクションをサポートしています。これらのモデルは、すぐにデプロイできるように事前に変換およびチューニングされているため、CPU、GPU、NPU のピークパフォーマンスをすぐに活用できます。

Gemma ファミリー
- Gemma 3 270M
- Gemma 3 1B
- Gemma 3n E2B/E4B
- EmbeddingGemma 300M
- 関数 Gemma 270M
Qwen ファミリー
Llama
ファイ
SmoLM
FastVLM