Gemini

Варианты модели

Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:

Вариант модели Вход(ы) Выход Оптимизирован для
Близнецы 1.5 Про
gemini-1.5-pro
Аудио, изображения, видео и текст Текст Сложные задачи рассуждения, такие как генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных.
Близнецы 1.5 Флэш
gemini-1.5-flash
Аудио, изображения, видео и текст Текст Быстрая и универсальная производительность при выполнении широкого спектра задач.
Близнецы 1.0 Про
gemini-1.0-pro
Текст Текст Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода
(Устарело) Gemini 1.0 Pro Vision
gemini-pro-vision
Изображения, видео и текст Текст Задачи, связанные с визуальными эффектами, такие как создание описаний изображений или идентификация объектов на изображениях.
Встраивание текста
text-embedding-004
Текст Встраивание текста Измерение связанности текстовых строк
АКА
aqa
Текст Текст Предоставление обоснованных ответов на вопросы

В следующей таблице описаны атрибуты моделей Gemini, общие для всех вариантов модели:

Атрибут Описание
Данные обучения Крайний срок получения информации для Близнецов — ноябрь 2023 года. Знания о событиях после этого времени ограничены.
Поддерживаемые языки Посмотреть доступные языки
Настраиваемые параметры модели
  • Топ р
  • Топ к
  • Температура
  • Остановить последовательность
  • Максимальная длина вывода
  • Количество кандидатов на ответ

Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства по генеративным моделям.

Близнецы 1.5 Флэш

Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-flash
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

3600

Максимальная длина видео

1 час

Максимальная длина звука

Примерно 9,5 часов

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 1 миллион транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 1000 об/мин
  • 2 миллиона транзакций в минуту
Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

Последнее обновление май 2024 г.

Близнецы 1.5 Про

Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-pro
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

2 097 152

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

7200

Максимальная длина видео

2 часа

Максимальная длина звука

Примерно 19 часов

Ограничения скорости [**]
Бесплатно:
  • 2 об/мин
  • 32 000 транзакций в минуту
  • 50 РПД
Плати как сможешь:
  • 360 об/мин
  • 2 миллиона транзакций в минуту
  • 10 000 РПД
Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

Последнее обновление май 2024 г.

Близнецы 1.0 Про

Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.0-pro
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 32 000 транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 360 об/мин
  • 120 000 транзакций в минуту
  • 30 000 РПД
Возможности

Системные инструкции

Не поддерживается

JSON-режим

Не поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Не поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Не поддерживается

Выполнение кода

Не поддерживается

Последнее обновление февраль 2024 г.

(Устарело) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision — это мультимодальная модель с оптимизированной производительностью, которая может выполнять задачи, связанные с визуализацией. Например, Pro Vision 1.0 может генерировать описания изображений, идентифицировать объекты, присутствующие на изображениях, предоставлять информацию о местах или объектах, присутствующих на изображениях, и многое другое.

Детали модели

Свойство Описание
Код модели models/gemini-pro-vision
Поддерживаемые типы данных

Входы

Изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

12 288

Лимит выходных токенов

4096

Аудио/видео характеристики

Максимальная длина видео

2 минуты

Ограничения скорости [**] 60 запросов в минуту
Возможности

Системные инструкции

Не поддерживается

JSON-режим

Не поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Не поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Не поддерживается

Выполнение кода

Не поддерживается

Последнее обновление декабрь 2023 г.

Встраивание текста и встраивание

Встраивание текста

Вы можете использовать модель внедрения текста для создания внедрений текста для входного текста. Для получения дополнительной информации о модели встраивания текста посетите документацию по встраиванию текста в разделе Генеративный ИИ на Vertex AI .

Модель внедрения текста оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов. Встраивание текста предлагает размеры эластичного внедрения до 768. Вы можете использовать эластичное внедрение для создания меньших размеров вывода и потенциально сэкономить затраты на вычисления и хранение с незначительной потерей производительности.

Детали модели
Свойство Описание
Код модели

Близнецы API

models/text-embedding-004

Вертексный ИИ

text-embedding-preview-0409

Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление апрель 2024 г.

Встраивание

Вы можете использовать модель внедрения для создания внедрений текста для входного текста.

Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.

Встраивание деталей модели
Свойство Описание
Код модели models/embedding-001
Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление декабрь 2023 г.

АКА

Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.

Детали модели

Свойство Описание
Код модели models/aqa
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Поддерживаемый язык Английский
Лимиты токенов [*]

Лимит входных токенов

7,168

Лимит выходных токенов

1024

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Поддерживается
Последнее обновление декабрь 2023 г.

Посмотрите примеры , чтобы изучить возможности этих вариантов модели.

[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.

[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день

Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.

Шаблоны названий версий моделей

Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.

  • Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.

    Чтобы указать последнюю версию, используйте следующий шаблон: <model>-<generation>-<variation>-latest . Например, gemini-1.0-pro-latest .

  • Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.

    Чтобы указать последнюю стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation> . Например, gemini-1.0-pro .

  • Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.

    Чтобы указать стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-1.0-pro-001 .

Доступные языки

Модели Gemini обучены работе со следующими языками:

  • арабский ( ar )
  • Бенгальский ( bn )
  • Болгарский ( bg )
  • Китайский упрощенный и традиционный ( zh )
  • Хорватский ( hr )
  • Чешский ( cs )
  • датский ( da )
  • Голландский ( nl )
  • английский ( en )
  • Эстонский ( et )
  • Финский ( fi )
  • французский ( fr .)
  • немецкий ( de )
  • Греческий ( el )
  • Иврит ( iw )
  • Хинди ( hi )
  • венгерский ( hu )
  • Индонезийский ( id )
  • Итальянский ( it )
  • японский ( ja )
  • Корейский ( ko )
  • Латышский ( lv .)
  • Литовский ( lt )
  • Норвежский ( no )
  • польский ( pl )
  • Португальский ( pt )
  • Румынский ( ro )
  • Русский ( ru )
  • Сербский ( sr )
  • словацкий ( sk )
  • Словенский ( sl )
  • Испанский ( es )
  • Суахили ( sw .)
  • Шведский ( sv )
  • тайский ( th )
  • турецкий ( tr )
  • Украинский ( uk )
  • Вьетнамский ( vi )