Google AI Edge | Google AI for Developers

Google AI Edge Portal のご紹介: エッジ AI を大規模にベンチマークします。限定公開プレビュー中にアクセスをリクエストするには、登録してください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

LiteRT-LM を使用してオンデバイスで LLM を実行する

エッジデバイスで高性能なクロスプラットフォーム LLM デプロイを実現するように設計された、本番環境対応のオープンソース推論フレームワーク。

概要開始する

スポットライト

マルチトークン予測（MTP）で Gemma 4 のオンデバイス推論を強化します。モバイル GPU で 2 倍以上のデコード速度を実現し、画質劣化をゼロに抑えます。

ブログ投稿ガイド

LiteRT-LM を選ぶ理由

クロスプラットフォーム

Android、iOS、ウェブ、パソコンに LLM をデプロイします。

ハードウェアアクセラレーション

GPU と NPU のアクセラレーションでパフォーマンスを最大化します。

幅広い生成 AI 機能

一般的な LLM のほか、マルチモーダル（Vision、Audio）とツール使用のサポート。

構築を開始

Python

Linux、MacOS、Windows、Raspberry Pi でハードウェアアクセラレーションを使用する Python API。

Python ガイド

Android

ネイティブ Android アプリと JVM ベースのデスクトップツール。

Android ガイド

iOS

ネイティブ iOS（macOS は近日提供予定）Swift API。

Swift ガイド

Web

WebGPU アクセラレーションを使用したブラウザベースのウェブアプリ用の JavaScript API と TypeScript API。

ウェブガイド

Flutter

コミュニティで管理されている flutter_gemma パッケージを使用して、クロスプラットフォームの Flutter アプリを構築します。

Flutter ガイド

C++

クロスプラットフォーム C++ API。

C++ ガイド

ファイルビルダー

変換された LiteRT モデルから .litertlm ファイルをビルドします。

ファイルビルダーガイド

コミュニティに参加

GitHub の LiteRT-LM

オープンソースプロジェクトに貢献し、問題を報告して、例を確認します。

GitHub で表示

Hugging Face

変換済みのモデル（Gemma、Qwen など）をダウンロードして、ディスカッションに参加してください。

Hugging Face で表示

ブログとお知らせ

Gemma 4 で最先端のエージェントスキルをエッジに導入します。

LiteRT-LM を使用して、アプリ内や幅広いデバイスに Gemma 4 をデプロイし、優れたパフォーマンスとリーチを実現します。

Chrome、Chromebook Plus、Google Pixel Watch のオンデバイス生成 AI

LiteRT-LM を使用して、ウェアラブルやブラウザベースのプラットフォームに言語モデルを大規模にデプロイします。

Google AI Edge ギャラリーのオンデバイス関数呼び出し

FunctionGemma をファインチューニングし、LiteRT-LM Tool Use API を活用した関数呼び出し機能を有効にする方法について説明します。

Google AI Edge の小規模言語モデル、マルチモーダル、関数呼び出し

エッジ言語モデルの RAG、マルチモダリティ、関数呼び出しに関する最新の分析情報。

クロス プラットフォーム

ハードウェア アクセラレーション

幅広い生成 AI 機能

クロスプラットフォーム

ハードウェアアクセラレーション