Gemini

Варианты модели

Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:

Вариант модели Вход(ы) Выход Оптимизирован для
Близнецы 1.5 Про
gemini-1.5-pro
Аудио, изображения, видео и текст Текст Сложные логические задачи, такие как генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных.
Близнецы 1.5 Флэш
gemini-1.5-flash
Аудио, изображения, видео и текст Текст Быстрая и универсальная производительность при выполнении широкого спектра задач.
Близнецы 1.0 Про
gemini-1.0-pro
Текст Текст Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода
Встраивание текста
text-embedding-004
Текст Встраивание текста Измерение связанности текстовых строк
АКА
aqa
Текст Текст Предоставление обоснованных ответов на вопросы

В следующей таблице описаны атрибуты моделей Gemini, общие для всех вариантов модели:

Атрибут Описание
Данные обучения Крайний срок получения информации для Близнецов — ноябрь 2023 года. Знания о событиях после этого времени ограничены.
Поддерживаемые языки Посмотреть доступные языки
Настраиваемые параметры модели
  • Топ р
  • Топ к
  • Температура
  • Остановить последовательность
  • Максимальная длина вывода
  • Количество кандидатов на ответ

Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства по генеративным моделям.

Близнецы 1.5 Флэш

Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-flash
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

3600

Максимальная длина видео

1 час

Максимальная длина звука

Примерно 9,5 часов

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 1 миллион транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 1000 об/мин
  • 2 миллиона транзакций в минуту
Возможности

Системные инструкции

Поддерживается

Режим JSON

Поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

Последнее обновление май 2024 г.

Близнецы 1.5 Про

Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-pro
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

2 097 152

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

7200

Максимальная длина видео

2 часа

Максимальная длина звука

Примерно 19 часов

Ограничения скорости [**]
Бесплатно:
  • 2 об/мин
  • 32 000 транзакций в минуту
  • 50 РПД
Плати как сможешь:
  • 360 об/мин
  • 2 миллиона транзакций в минуту
  • 10 000 РПД
Возможности

Системные инструкции

Поддерживается

Режим JSON

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Поддерживается

Выполнение кода

Поддерживается

Последнее обновление май 2024 г.

Близнецы 1.0 Про

Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.

Попробуйте в AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.0-pro
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Ограничения скорости [**]
Бесплатно:
  • 15 об/мин
  • 32 000 транзакций в минуту
  • 1500 РПД
Плати как сможешь:
  • 360 об/мин
  • 120 000 транзакций в минуту
  • 30 000 РПД
Возможности

Системные инструкции

Не поддерживается

Режим JSON

Не поддерживается

Схема JSON

Не поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Не поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Конфигурация вызова функции

Не поддерживается

Выполнение кода

Не поддерживается

Последнее обновление февраль 2024 г.

Встраивание текста и встраивание

Встраивание текста

Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.

text-embedding-004 обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.

Детали модели
Свойство Описание
Код модели

Близнецы API

models/text-embedding-004

Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление апрель 2024 г.

Встраивание

Вы можете использовать модель внедрения для создания внедрений текста для входного текста.

Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.

Встраивание деталей модели
Свойство Описание
Код модели models/embedding-001
Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление декабрь 2023 г.

АКА

Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.

Детали модели

Свойство Описание
Код модели models/aqa
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Поддерживаемый язык Английский
Лимиты токенов [*]

Лимит входных токенов

7,168

Лимит выходных токенов

1024

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Поддерживается
Последнее обновление декабрь 2023 г.

Посмотрите примеры , чтобы изучить возможности этих вариантов модели.

[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.

[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день

Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.

Шаблоны названий версий моделей

Модели Gemini доступны как в предварительной , так и в стабильной версии. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.

  • Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.

    Чтобы указать последнюю версию, используйте следующий шаблон: <model>-<generation>-<variation>-latest . Например, gemini-1.0-pro-latest .

  • Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.

    Чтобы указать последнюю стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation> . Например, gemini-1.0-pro .

  • Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.

    Чтобы указать стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-1.0-pro-001 .

Доступные языки

Модели Gemini обучены работе со следующими языками:

  • арабский ( ar )
  • Бенгальский ( bn )
  • Болгарский ( bg )
  • Китайский упрощенный и традиционный ( zh )
  • Хорватский ( hr )
  • Чешский ( cs )
  • датский ( da )
  • голландский ( nl )
  • английский ( en )
  • Эстонский ( et )
  • финский ( fi )
  • французский ( fr .)
  • немецкий ( de )
  • Греческий ( el )
  • Иврит ( iw )
  • Хинди ( hi )
  • венгерский ( hu )
  • Индонезийский ( id )
  • Итальянский ( it )
  • японский ( ja )
  • Корейский ( ko )
  • Латышский ( lv .)
  • Литовский ( lt )
  • Норвежский ( no )
  • польский ( pl )
  • Португальский ( pt )
  • Румынский ( ro )
  • Русский ( ru )
  • Сербский ( sr )
  • словацкий ( sk )
  • Словенский ( sl )
  • Испанский ( es )
  • Суахили ( sw .)
  • Шведский ( sv )
  • тайский ( th )
  • турецкий ( tr )
  • Украинский ( uk )
  • Вьетнамский ( vi )