Платформа Google Cloud предоставляет множество возможностей для развертывания, обслуживания и тонкой настройки открытых моделей Gemma 4, включая следующие:
- Платформа корпоративных агентов Gemini
- Cloud Run
- Google Kubernetes Engine (GKE)
- Комплект для разработки агентов (ADK)
- Учебные кластеры платформы агентов Gemini Enterprise
- МаксТекст
- vLLM с TPUs
- Суверенное облако
Платформа корпоративных агентов Gemini
Gemini Enterprise Agent Platform — это платформа Google Cloud для быстрого создания и масштабирования проектов машинного обучения. Gemma 4 доступна в Model Garden , тщательно отобранной коллекции моделей на платформе Gemini Enterprise Agent Platform. Вы можете тестировать и развертывать модели непосредственно из консоли.
Для получения более подробной информации обратитесь к следующим страницам:
- Обзор платформы для агентов : Начните работу с платформой для агентов Gemini Enterprise.
- Gemma с Gemini Enterprise Agent Platform : Используйте открытые модели Gemma с Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run — это полностью управляемая платформа для запуска вашего кода или контейнеров на высокомасштабируемой инфраструктуре Google. Разверните Gemma 4 на Cloud Run, используя графические процессоры (GPU), для масштабируемого до нуля вывода данных с оплатой по факту использования.
Для больших размеров моделей используйте расширенные конфигурации с графическими процессорами RTX 6000 Pro и технологией потоковой передачи моделей.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) — это управляемый сервис Kubernetes от Google Cloud. Запустите Gemma 4 на GKE для оркестрации контейнеров корпоративного уровня. Используйте TPU и GPU для обслуживания моделей с высокой пропускной способностью и низкой задержкой.
Комплект для разработки агентов (ADK)
Создавайте и управляйте агентами ИИ с помощью Gemma 4 и комплекта разработки агентов (ADK) . Мощные возможности Gemma 4 по рассуждениям и вызову функций делают её идеальной для рабочих процессов с участием агентов.
Учебные кластеры платформы агентов Gemini Enterprise
Оптимизируйте Gemma 4 с помощью обучающих кластеров платформы корпоративных агентов Gemini . Обучающие кластеры предоставляют оптимизированную инфраструктуру для крупномасштабного обучения и тонкой настройки открытых моделей.
vLLM с TPUs
Используйте Google Cloud TPU для запуска Gemma 4 и достижения высочайшей производительности.
МаксТекст
Gemma 4 поддерживается в MaxText , высокопроизводительной реализации JAX LLM произвольного размера для TPU Google Cloud.
Суверенное облако
Gemma 4 доступна в решениях Sovereign Cloud , обеспечивая расширенный контроль и соответствие требованиям для конфиденциальных рабочих нагрузок.
,Платформа Google Cloud предоставляет множество возможностей для развертывания, обслуживания и тонкой настройки открытых моделей Gemma 4, включая следующие:
- Платформа корпоративных агентов Gemini
- Cloud Run
- Google Kubernetes Engine (GKE)
- Комплект для разработки агентов (ADK)
- Учебные кластеры платформы агентов Gemini Enterprise
- МаксТекст
- vLLM с TPUs
- Суверенное облако
Платформа корпоративных агентов Gemini
Gemini Enterprise Agent Platform — это платформа Google Cloud для быстрого создания и масштабирования проектов машинного обучения. Gemma 4 доступна в Model Garden , тщательно отобранной коллекции моделей на платформе Gemini Enterprise Agent Platform. Вы можете тестировать и развертывать модели непосредственно из консоли.
Для получения более подробной информации обратитесь к следующим страницам:
- Обзор платформы для агентов : Начните работу с платформой для агентов Gemini Enterprise.
- Gemma с Gemini Enterprise Agent Platform : Используйте открытые модели Gemma с Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run — это полностью управляемая платформа для запуска вашего кода или контейнеров на высокомасштабируемой инфраструктуре Google. Разверните Gemma 4 на Cloud Run, используя графические процессоры (GPU), для масштабируемого до нуля вывода данных с оплатой по факту использования.
Для больших размеров моделей используйте расширенные конфигурации с графическими процессорами RTX 6000 Pro и технологией потоковой передачи моделей.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) — это управляемый сервис Kubernetes от Google Cloud. Запустите Gemma 4 на GKE для оркестрации контейнеров корпоративного уровня. Используйте TPU и GPU для обслуживания моделей с высокой пропускной способностью и низкой задержкой.
Комплект для разработки агентов (ADK)
Создавайте и управляйте агентами ИИ с помощью Gemma 4 и комплекта разработки агентов (ADK) . Мощные возможности Gemma 4 по рассуждениям и вызову функций делают её идеальной для рабочих процессов с участием агентов.
Учебные кластеры платформы агентов Gemini Enterprise
Оптимизируйте Gemma 4 с помощью обучающих кластеров платформы корпоративных агентов Gemini . Обучающие кластеры предоставляют оптимизированную инфраструктуру для крупномасштабного обучения и тонкой настройки открытых моделей.
vLLM с TPUs
Используйте Google Cloud TPU для запуска Gemma 4 и достижения высочайшей производительности.
МаксТекст
Gemma 4 поддерживается в MaxText , высокопроизводительной реализации JAX LLM произвольного размера для TPU Google Cloud.
Суверенное облако
Gemma 4 доступна в решениях Sovereign Cloud , обеспечивая расширенный контроль и соответствие требованиям для конфиденциальных рабочих нагрузок.