Gemma 4 がリリースされました。テキスト、音声、画像の入力に対応し、最大 256, 000 トークンの長いコンテキスト ウィンドウを備えています。
詳細
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
モバイル デバイスに Gemma をデプロイする
このドキュメントでは、Google AI Edge Gallery アプリや MediaPipe LLM Inference API の使用など、モバイル デバイスに Gemma モデルをデプロイして実行するためのさまざまな方法とツールについて説明します。
ファインチューニングされた Gemma モデルを LiteRT バージョンに変換する方法については、変換ガイドをご覧ください。
Google AI Edge ギャラリー アプリ
LLM 推論 API の動作を確認し、タスク バンドルモデルをテストするには、Google AI Edge Gallery アプリを使用します。このアプリは、オンデバイス LLM とやり取りするためのユーザー インターフェースを提供します。これにより、次のことが可能になります。
- モデルをインポート: カスタム
.task モデルをアプリに読み込みます。
- パラメータを構成する: 温度やトップ K などの設定を調整します。
- テキストを生成: プロンプトを入力して、モデルのレスポンスを表示します。
- パフォーマンスをテストする: モデルの速度と精度を評価します。
独自のモデルをインポートする手順など、Google AI Edge Gallery アプリの使用方法に関する詳細なガイドについては、アプリのドキュメントをご覧ください。
MediaPipe LLM 推論 API を使用して、モバイル デバイスで Gemma モデルを実行できます。LLM 推論 API は大規模言語モデルのラッパーとして機能し、情報検索、メールの作成、ドキュメントの要約などの一般的なテキストからテキストへの生成タスクで Gemma モデルをオンデバイスで実行できます。
LLM 推論 API は、次のモバイル プラットフォームで利用できます。
詳しくは、MediaPipe LLM 推論のドキュメントをご覧ください。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-09-11 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-09-11 UTC。"],[],[]]