Google AI Edge | Google AI for Developers

Memperkenalkan Google AI Edge Portal: Lakukan benchmark Edge AI dalam skala besar. Daftar untuk meminta akses selama pratinjau pribadi.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Menjalankan LLM di perangkat dengan LiteRT-LM

Framework inferensi open source yang siap produksi dan dirancang untuk menghadirkan deployment LLM lintas platform berperforma tinggi di perangkat edge.

Ringkasan Mulai

Sorotan

Baca blog terbaru kami untuk mengetahui cara LiteRT-LM meningkatkan kualitas deployment GenAI di perangkat Anda, sehingga mengoptimalkan potensi Gemma 4 dengan kecepatan luar biasa dan efisiensi yang tak tertandingi dengan API Swift, JavaScript, dan Flutter yang baru ditambahkan.

Postingan blog Ringkasan

Mengapa LiteRT-LM?

Lintas-platform

Deploy LLM di Android, iOS, Web, dan Desktop.

Dipercepat hardware

Maksimalkan performa dengan akselerasi GPU dan NPU.

Kemampuan GenAI yang Luas

Dukungan untuk LLM populer serta multi-modalitas (Vision, Audio) dan Penggunaan Alat.

Mulai membuat

Python

API Python dengan akselerasi hardware di Linux, MacOS, Windows, dan Raspberry Pi.

Android

Aplikasi Android native dan alat desktop berbasis JVM.

Panduan Android

iOS

API Swift iOS Native (macOS akan segera hadir).

Web

JavaScript dan TypeScript API untuk aplikasi web berbasis browser dengan akselerasi WebGPU.

Panduan Web

Flutter

Buat aplikasi Flutter lintas platform menggunakan paket flutter_gemma yang dikelola komunitas.

Panduan Flutter

C++

x-platform C++ API .

Panduan C++

File Builder

Buat file .litertlm dari model LiteRT yang dikonversi.

Panduan Pembuat File

Bergabung dengan Komunitas

LiteRT-LM di GitHub

Berkontribusi pada project open source, melaporkan masalah, dan melihat contoh.

Lihat di GitHub

Hugging Face

Download model yang telah dikonversi sebelumnya (Gemma, Qwen, dan lainnya), dan bergabunglah dalam diskusi.

Lihat di Hugging Face

Blog dan Pengumuman

Meningkatkan inferensi di perangkat Gemma 4 dengan Prediksi Multi-Token (MTP)

Nikmati kecepatan decoding >2x lebih cepat di GPU seluler tanpa penurunan kualitas.

Hadirkan kemampuan agentic canggih ke edge dengan Gemma 4.

Deploy Gemma 4 dalam aplikasi dan di berbagai perangkat dengan performa dan jangkauan yang luar biasa menggunakan LiteRT-LM.

GenAI di perangkat di Chrome, Chromebook Plus, dan Pixel Watch

Men-deploy model bahasa di platform berbasis browser dan perangkat wearable menggunakan LiteRT-LM dalam skala besar.

Panggilan fungsi di perangkat di Google AI Edge Gallery

Pelajari cara menyetel FunctionGemma dan mengaktifkan kemampuan panggilan fungsi yang didukung oleh LiteRT-LM Tool Use API.

Model bahasa kecil, multi-modalitas, dan pemanggilan fungsi Google AI Edge

Insight terbaru tentang RAG, multimodalitas, dan panggilan fungsi untuk model bahasa edge.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2026-05-19 UTC.