텍스트, 오디오, 이미지 입력과 최대 256K의 긴 컨텍스트 창을 지원하는 Gemma 4 가 출시되었습니다. 자세히 알아보기

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Google Cloud에서 Gemma 배포

Google Cloud 플랫폼은 다음과 같은 Gemma 4 오픈 모델을 배포, 제공, 미세 조정하기 위한 다양한 옵션을 제공합니다.

Vertex AI Model Garden

Vertex AI는 머신러닝 프로젝트를 빠르게 빌드하고 확장하기 위한 Google Cloud 플랫폼입니다. Gemma 4는 Vertex AI의 엄선된 모델 모음인 Model Garden에서 사용할 수 있습니다. 콘솔에서 직접 모델을 테스트하고 배포할 수 있습니다.

자세한 내용은 다음 페이지를 참고하세요.

Cloud Run은 Google의 확장성이 뛰어난 인프라에서 코드 또는 컨테이너를 실행하는 완전 관리형 플랫폼입니다. GPU를 사용하여 Cloud Run에 Gemma 4를 배포 하여 규모 축소, 사용량 기반 요금 추론을 수행합니다.

더 큰 모드 크기의 경우 고급 구성 을 RTX 6000 Pro GPU 및 모델 스트리밍으로 활용합니다.

Google Kubernetes Engine (GKE) 은 Google Cloud의 관리형 Kubernetes 서비스입니다. 엔터프라이즈급 컨테이너 오케스트레이션을 위해 GKE에서 Gemma 4를 실행합니다. TPU 및 GPU를 사용하여 높은 처리량과 짧은 지연 시간으로 모델을 제공합니다.

Gemma 4 및 에이전트 개발 키트 (ADK)로 AI 에이전트를 빌드하고 오케스트레이션합니다. Gemma 4의 강력한 추론 및 함수 호출 기능은 에이전트형 워크플로에 적합합니다.

Vertex AI 학습 클러스터 (VTC)를 사용하여 Gemma 4를 미세 조정합니다. VTC는 오픈 모델의 대규모 학습 및 미세 조정을 위한 최적화된 인프라를 제공합니다.

Gemma 4는 MaxText에서 지원됩니다. Google Cloud TPU를 위한 고성능의 임의 크기 JAX LLM 구현입니다.

Gemma 4는 Sovereign Cloud 솔루션에서 사용할 수 있으며, 민감한 워크로드에 대한 향상된 제어 및 규정 준수를 제공합니다.