1.5
искрыНаша самая быстрая и экономичная мультимодальная модель с отличной производительностью для высокочастотных задач.
- Вводите аудио, изображения, видео и текст, получайте текстовые ответы.
- Генерируйте код, извлекайте данные, редактируйте текст и многое другое.
- Лучше всего подходит для узких, высокочастотных задач.
Варианты модели
Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:
Вариант модели | Вход(ы) | Выход | Оптимизирован для |
---|---|---|---|
Близнецы 1.5 Флэшgemini-1.5-flash | Аудио, изображения, видео и текст | Текст | Быстрая и универсальная производительность при выполнении широкого спектра задач. |
Близнецы 1.5 Проgemini-1.5-pro | Аудио, изображения, видео и текст | Текст | Сложные задачи рассуждения, такие как генерация кода и текста, редактирование текста, решение проблем, извлечение и генерация данных. |
Близнецы 1.0 Проgemini-1.0-pro | Текст | Текст | Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода |
Встраивание текстаtext-embedding-004 | Текст | Встраивание текста | Измерение связанности текстовых строк |
АКАaqa | Текст | Текст | Предоставление обоснованных ответов на вопросы |
В следующей таблице описаны атрибуты моделей Gemini, общие для всех вариантов модели:
Атрибут | Описание |
---|---|
Данные обучения | Крайний срок получения информации для Близнецов — ноябрь 2023 года. Знания о событиях после этого времени ограничены. |
Поддерживаемые языки | Посмотреть доступные языки |
Настраиваемые параметры модели |
|
Информацию о каждом из этих параметров см. в разделе «Параметры модели» руководства по генеративным моделям.
Близнецы 1.5 Флэш
Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.5-flash |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Текст |
[*] | Лимиты токеновЛимит входных токенов 1 048 576 Лимит выходных токенов 8,192 |
Аудио/видео характеристики | Максимальное количество изображений в запросе 3600 Максимальная длина видео 1 час Максимальная длина звука Примерно 9,5 часов |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Поддерживается Режим JSON Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Конфигурация вызова функции Поддерживается Выполнение кода Поддерживается |
версии |
|
Последнее обновление | май 2024 г. |
Близнецы 1.5 Про
Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.5-pro |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Текст |
[*] | Лимиты токеновЛимит входных токенов 2 097 152 Лимит выходных токенов 8,192 |
Аудио/видео характеристики | Максимальное количество изображений в запросе 7200 Максимальная длина видео 2 часа Максимальная длина звука Примерно 19 часов |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Поддерживается Режим JSON Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Не поддерживается Вызов функции Поддерживается Конфигурация вызова функции Поддерживается Выполнение кода Поддерживается |
версии |
|
Последнее обновление | май 2024 г. |
Близнецы 1.0 Про
Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.0-pro |
Поддерживаемые типы данных | Вход Текст Выход Текст |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Не поддерживается Режим JSON Не поддерживается Схема JSON Не поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Не поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Конфигурация вызова функции Не поддерживается Выполнение кода Не поддерживается |
версии |
|
Последнее обновление | февраль 2024 г. |
Встраивание текста и встраивание
Встраивание текста
Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.
text-embedding-004
обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.
Детали модели
Свойство | Описание |
---|---|
Код модели | Близнецы API |
Поддерживаемые типы данных | Вход Текст Выход Встраивание текста |
[*] | Лимиты токеновЛимит входных токенов 2048 Размер выходного размера 768 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Не поддерживается |
Последнее обновление | апрель 2024 г. |
Встраивание
Вы можете использовать модель внедрения для создания внедрений текста для входного текста.
Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.
Встраивание деталей модели
Свойство | Описание |
---|---|
Код модели | models/embedding-001 |
Поддерживаемые типы данных | Вход Текст Выход Встраивание текста |
[*] | Лимиты токеновЛимит входных токенов 2048 Размер выходного размера 768 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Не поддерживается |
Последнее обновление | декабрь 2023 г. |
АКА
Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/aqa |
Поддерживаемые типы данных | Вход Текст Выход Текст |
Поддерживаемый язык | Английский |
[*] | Лимиты токеновЛимит входных токенов 7,168 Лимит выходных токенов 1024 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Поддерживается |
Последнее обновление | декабрь 2023 г. |
Посмотрите примеры , чтобы изучить возможности этих вариантов модели.
[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.
[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день
Из-за ограничений емкости указанные ограничения максимальной скорости не гарантируются.
Шаблоны названий версий моделей
Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.
Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.
Чтобы указать последнюю версию, используйте следующий шаблон:
<model>-<generation>-<variation>-latest
. Например,gemini-1.0-pro-latest
.Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.
Чтобы указать последнюю стабильную версию, используйте следующий шаблон:
<model>-<generation>-<variation>
. Например,gemini-1.0-pro
.Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.
Чтобы указать стабильную версию, используйте следующий шаблон:
<model>-<generation>-<variation>-<version>
. Например,gemini-1.0-pro-001
.Экспериментальная модель. Указывает на экспериментальную модель, доступную в предварительной версии, как определено в Условиях , что означает, что она не предназначена для промышленного использования. Мы выпускаем экспериментальные модели, чтобы собрать отзывы, быстро передать последние обновления разработчикам и подчеркнуть темпы инноваций, происходящих в Google. То, что мы узнаем из экспериментальных запусков, помогает нам выпускать модели более широко. Экспериментальная модель может быть заменена на другую без предварительного уведомления. Мы не гарантируем, что экспериментальная модель станет стабильной в будущем.
Чтобы указать экспериментальную версию, используйте следующий шаблон:
<model>-<generation>-<variation>-<version>
. Например,gemini-1.5-pro-exp-0801
.
Доступные языки
Модели Gemini обучены работе со следующими языками:
- арабский (
ar
) - Бенгальский (
bn
) - Болгарский (
bg
) - Китайский упрощенный и традиционный (
zh
) - Хорватский (
hr
) - Чешский (
cs
) - датский (
da
) - Голландский (
nl
) - английский (
en
) - Эстонский (
et
) - Финский (
fi
) - французский (
fr
.) - немецкий (
de
) - Греческий (
el
) - Иврит (
iw
) - Хинди (
hi
) - венгерский (
hu
) - Индонезийский (
id
) - Итальянский (
it
) - японский (
ja
) - Корейский (
ko
) - Латышский (
lv
.) - Литовский (
lt
) - Норвежский (
no
) - польский (
pl
) - Португальский (
pt
) - Румынский (
ro
) - Русский (
ru
) - Сербский (
sr
) - словацкий (
sk
) - Словенский (
sl
) - Испанский (
es
) - Суахили (
sw
.) - Шведский (
sv
) - тайский (
th
) - турецкий (
tr
) - Украинский (
uk
) - Вьетнамский (
vi
)