Gemini 모델 제품군의 가장 작은 버전인 Gemini 나노는 Google Pixel 8 Pro 및 삼성 S24 시리즈부터 지원되는 Android 기기에서 기기에서 실행할 수 있습니다.
Android에서 Gemini Nano 모델을 실행하려면 다음을 위한 API를 제공하는 Android용 Google AI Edge SDK를 사용해야 합니다.
- 기본 Android 지원 기기가 지원되는지 확인합니다.
- Gemini 나노 모델 액세스 권한을 얻습니다.
- 안전 설정을 조정합니다.
- 고성능으로 추론을 실행하고 대체를 구현합니다.
- 원하는 경우 LoRA 미세 조정 블록을 제공하여 사용 사례에 맞게 모델 성능을 개선합니다.
Gemini Nano에 액세스하기 위한 API는 텍스트 간 모달리티를 지원하며 향후 더 많은 모달리티가 제공될 예정입니다.
기기 내 실행의 이점
기기 내 실행은 다음을 사용 설정합니다.
- 민감한 정보의 로컬 처리: 데이터를 로컬에서 처리하면 사용자 데이터가 클라우드로 전송되는 것을 방지할 수 있습니다. 이는 엔드 투 엔드 암호화를 사용하는 메시지 앱과 같이 민감한 정보를 처리하는 앱에 중요합니다.
- 오프라인 액세스: 사용자는 인터넷에 연결되어 있지 않아도 AI 기능에 액세스할 수 있습니다. 이는 오프라인으로 작동하거나 연결이 다양해야 하는 애플리케이션에 유용합니다.
- 비용 절감: 실행을 소비자 하드웨어로 오프로드하여 추론 비용을 줄일 수 있습니다. 이렇게 하면 자주 사용되는 사용자 흐름에서 상당한 비용을 절약할 수 있습니다.
Gemini를 기기 내에서 실행하면 많은 이점이 있습니다. 그러나 더 큰 Gemini 모델이 필요하고 다양한 기기를 지원하는 사용 사례의 경우 서버에서 Gemini에 액세스하는 데 Gemini API를 사용하는 것이 좋습니다. 백엔드 통합 (Python, Go, Node.js 또는 REST 사용)을 통해 또는 새로운 Android용 Google AI 클라이언트 SDK를 통해 Android 앱에서 직접 이를 수행할 수 있습니다.
사용 방법
Gemini Nano의 기기 내 실행은 Android 14에서 도입된 기기 내 실행을 위한 기반 모델에 대한 액세스를 제공하는 새로운 시스템 수준 기능인 Android AICore를 기반으로 합니다. 기반 모델은 AICore를 사용하여 사전 설치되므로 앱 내에서 다운로드하거나 배포할 필요가 없습니다. LoRa를 사용하여 다운스트림 작업에 맞게 모델을 미세 조정할 수 있습니다. Android AICore는 이제 Google Pixel 8 Pro 및 삼성 S24 시리즈 기기에서 프로덕션 버전으로 제공되며 이미 Google 앱의 혁신적인 기능을 지원하고 있습니다.
자세한 내용은 Android AICore를 참고하세요.
다음 단계
기기에서 Gemini Nano를 앱에 사용하려면 Android용 Google AI Edge SDK의 사전 체험판 미리보기에 신청하세요.
Android 앱의 Google 서버에서 Gemini Pro 추론을 활용하는 방법을 알아보려면 Android용 Google AI 클라이언트 SDK 빠른 시작을 참고하세요.