Платформа Google Cloud предоставляет множество возможностей для развертывания, обслуживания и тонкой настройки открытых моделей Gemma 4, включая следующие:
- Модель сада Vertex AI
- Cloud Run
- Google Kubernetes Engine (GKE)
- Комплект для разработки агентов (ADK)
- Обучающие кластеры Vertex AI (VTC)
- МаксТекст
- vLLM с TPU
- Суверенное облако
Модель сада Vertex AI
Vertex AI — это платформа Google Cloud для быстрого создания и масштабирования проектов машинного обучения. Gemma 4 доступна в Model Garden , тщательно отобранной коллекции моделей на Vertex AI. Вы можете тестировать и развертывать модели непосредственно из консоли.
Для получения более подробной информации обратитесь к следующим страницам:
- Введение в Vertex AI : Начало работы с Vertex AI.
- Gemma с Vertex AI : Используйте открытые модели Gemma с Vertex AI.
Cloud Run
Cloud Run — это полностью управляемая платформа для запуска вашего кода или контейнеров на высокомасштабируемой инфраструктуре Google. Разверните Gemma 4 на Cloud Run, используя графические процессоры (GPU), для масштабируемого до нуля вывода данных с оплатой по факту использования.
Для больших размеров моделей используйте расширенные конфигурации с графическими процессорами RTX 6000 Pro и технологией потоковой передачи моделей.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) — это управляемый сервис Kubernetes от Google Cloud. Запустите Gemma 4 на GKE для оркестрации контейнеров корпоративного уровня. Используйте TPU и GPU для обслуживания моделей с высокой пропускной способностью и низкой задержкой.
Комплект для разработки агентов (ADK)
Создавайте и управляйте агентами ИИ с помощью Gemma 4 и комплекта разработки агентов (ADK) . Мощные возможности Gemma 4 по рассуждениям и вызову функций делают её идеальной для рабочих процессов с участием агентов.
Обучающие кластеры Vertex AI (VTC)
Доработайте Gemma 4 с помощью обучающих кластеров Vertex AI (VTC) . VTC предоставляет оптимизированную инфраструктуру для крупномасштабного обучения и доработки открытых моделей.
vLLM с TPU
Используйте Google Cloud TPU для запуска Gemma 4 и достижения высочайшей производительности.
МаксТекст
Gemma 4 поддерживается в MaxText , высокопроизводительной реализации JAX LLM произвольного размера для TPU Google Cloud.
Суверенное облако
Gemma 4 доступна в решениях Sovereign Cloud , обеспечивая расширенный контроль и соответствие требованиям для конфиденциальных рабочих нагрузок.