Разверните Gemma с помощью Google Cloud

Платформа Google Cloud предоставляет множество возможностей для развертывания, обслуживания и тонкой настройки открытых моделей Gemma 4, включая следующие:

Модель сада Vertex AI

Vertex AI — это платформа Google Cloud для быстрого создания и масштабирования проектов машинного обучения. Gemma 4 доступна в Model Garden , тщательно отобранной коллекции моделей на Vertex AI. Вы можете тестировать и развертывать модели непосредственно из консоли.

Для получения более подробной информации обратитесь к следующим страницам:

Cloud Run

Cloud Run — это полностью управляемая платформа для запуска вашего кода или контейнеров на высокомасштабируемой инфраструктуре Google. Разверните Gemma 4 на Cloud Run, используя графические процессоры (GPU), для масштабируемого до нуля вывода данных с оплатой по факту использования.

Для больших размеров моделей используйте расширенные конфигурации с графическими процессорами RTX 6000 Pro и технологией потоковой передачи моделей.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) — это управляемый сервис Kubernetes от Google Cloud. Запустите Gemma 4 на GKE для оркестрации контейнеров корпоративного уровня. Используйте TPU и GPU для обслуживания моделей с высокой пропускной способностью и низкой задержкой.

Комплект для разработки агентов (ADK)

Создавайте и управляйте агентами ИИ с помощью Gemma 4 и комплекта разработки агентов (ADK) . Мощные возможности Gemma 4 по рассуждениям и вызову функций делают её идеальной для рабочих процессов с участием агентов.

Обучающие кластеры Vertex AI (VTC)

Доработайте Gemma 4 с помощью обучающих кластеров Vertex AI (VTC) . VTC предоставляет оптимизированную инфраструктуру для крупномасштабного обучения и доработки открытых моделей.

vLLM с TPU

Используйте Google Cloud TPU для запуска Gemma 4 и достижения высочайшей производительности.

МаксТекст

Gemma 4 поддерживается в MaxText , высокопроизводительной реализации JAX LLM произвольного размера для TPU Google Cloud.

Суверенное облако

Gemma 4 доступна в решениях Sovereign Cloud , обеспечивая расширенный контроль и соответствие требованиям для конфиденциальных рабочих нагрузок.