2.0 Флэш-
Наша новейшая мультимодальная модель с функциями нового поколения и улучшенными возможностями.
- Ввод аудио, изображений, видео и текста — получение текстовых, изображений и звуковых ответов.
- Обеспечивает диалоговое взаимодействие с малой задержкой с помощью нашего мультимодального Live API.
1.5 Вспышка
Наша самая сбалансированная мультимодальная модель с отличными характеристиками для большинства задач.
- Вводите аудио, изображения, видео и текст, получайте текстовые ответы.
- Генерируйте код, извлекайте данные, редактируйте текст и многое другое.
- Лучше всего подходит для задач, сочетающих производительность и стоимость.
Варианты модели
Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:
Вариант модели | Вход(ы) | Выход | Оптимизирован для |
---|---|---|---|
Близнецы 2.0 Флэшgemini-2.0-flash-exp | Аудио, изображения, видео и текст | Текст, изображения (скоро) и аудио (скоро) | Функции нового поколения, скорость и мультимодальная генерация для самых разных задач. |
Близнецы 1.5 Флэшgemini-1.5-flash | Аудио, изображения, видео и текст | Текст | Быстрая и универсальная производительность при выполнении самых разных задач. |
Близнецы 1.5 Флэш-8Бgemini-1.5-flash-8b | Аудио, изображения, видео и текст | Текст | Задачи большого объема и низкого интеллекта |
Близнецы 1.5 Проgemini-1.5-pro | Аудио, изображения, видео и текст | Текст | Сложные логические задачи, требующие большего интеллекта |
(Устарело с 15 февраля 2025 г.) Gemini 1.0 Progemini-1.0-pro | Текст | Текст | Задачи на естественном языке, многоходовой текстовый и кодовый чат, а также генерация кода |
Встраивание текстаtext-embedding-004 | Текст | Встраивание текста | Измерение связанности текстовых строк |
АКАaqa | Текст | Текст | Предоставление обоснованных ответов на вопросы |
(Экспериментальный) Близнецы 2.0 Flash
Gemini 2.0 Flash предоставляет функции и улучшенные возможности нового поколения, включая превосходную скорость, использование собственных инструментов, мультимодальную генерацию и контекстное окно токена 1M. Узнайте больше о Gemini 2.0 Flash на нашей обзорной странице .
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-2.0-flash-exp |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Аудио (скоро), изображения (скоро) и текст |
[*] | Лимиты токеновЛимит входных токенов 1 048 576 Лимит выходных токенов 8,192 |
[**] | Ограничения скорости
|
Возможности | Структурированные результаты Поддерживается Кэширование Не поддерживается Тюнинг Не поддерживается Вызов функции Поддерживается Выполнение кода Поддерживается Поиск Поддерживается Генерация изображений Поддерживается Использование собственного инструмента Поддерживается Генерация звука Поддерживается |
версии |
|
Последнее обновление | декабрь 2024 г. |
Близнецы 1.5 Флэш
Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.5-flash |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Текст |
[*] | Лимиты токеновЛимит входных токенов 1 048 576 Лимит выходных токенов 8,192 |
Аудио/видео характеристики | Максимальное количество изображений в запросе 3600 Максимальная длина видео 1 час Максимальная длина звука Примерно 9,5 часов |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Поддерживается JSON-режим Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Выполнение кода Поддерживается Двунаправленная потоковая передача Не поддерживается |
версии |
|
Последнее обновление | Сентябрь 2024 г. |
Близнецы 1.5 Флэш-8Б
Gemini 1.5 Flash-8B — небольшая модель, предназначенная для задач с невысоким интеллектом.
Детали модели
Свойство | Описание |
---|---|
Model code | models/gemini-1.5-flash-8b |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Текст |
[*] | Лимиты токеновЛимит входных токенов 1 048 576 Лимит выходных токенов 8,192 |
Аудио/видео характеристики | Максимальное количество изображений в запросе 3600 Максимальная длина видео 1 час Максимальная длина звука Примерно 9,5 часов |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Поддерживается JSON-режим Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Выполнение кода Поддерживается Двунаправленная потоковая передача Не поддерживается |
версии |
|
Последнее обновление | октябрь 2024 г. |
Близнецы 1.5 Про
Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.5-pro |
Поддерживаемые типы данных | Входы Аудио, изображения, видео и текст Выход Текст |
[*] | Лимиты токеновЛимит входных токенов 2 097 152 Лимит выходных токенов 8,192 |
Аудио/видео характеристики | Максимальное количество изображений в запросе 7200 Максимальная длина видео 2 часа Максимальная длина звука Примерно 19 часов |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Поддерживается JSON-режим Поддерживается Схема JSON Поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Поддерживается Тюнинг Не поддерживается Вызов функции Поддерживается Выполнение кода Поддерживается Двунаправленная потоковая передача Не поддерживается |
версии |
|
Последнее обновление | Сентябрь 2024 г. |
(Устарело) Близнецы 1.0 Pro
Gemini 1.0 Pro — это модель НЛП, которая решает такие задачи, как многоходовой текстовый и кодовый чат, а также генерация кода.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/gemini-1.0-pro |
Поддерживаемые типы данных | Вход Текст Выход Текст |
[**] | Ограничения скорости
|
Возможности | Системные инструкции Не поддерживается JSON-режим Не поддерживается Схема JSON Не поддерживается Регулируемые настройки безопасности Поддерживается Кэширование Не поддерживается Тюнинг Поддерживается Вызов функции Поддерживается Конфигурация вызова функции Не поддерживается Выполнение кода Не поддерживается Двунаправленная потоковая передача Не поддерживается |
версии |
|
Последнее обновление | февраль 2024 г. |
Встраивание текста и встраивание
Встраивание текста
Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.
text-embedding-004
обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.
Детали модели
Свойство | Описание |
---|---|
Код модели | Близнецы API |
Поддерживаемые типы данных | Вход Текст Выход Встраивание текста |
[*] | Лимиты токеновЛимит входных токенов 2048 Размер выходного размера 768 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Не поддерживается |
Последнее обновление | апрель 2024 г. |
Встраивание
Вы можете использовать модель внедрения для создания внедрений текста для входного текста.
Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.
Встраивание деталей модели
Свойство | Описание |
---|---|
Код модели | models/embedding-001 |
Поддерживаемые типы данных | Вход Текст Выход Встраивание текста |
[*] | Лимиты токеновЛимит входных токенов 2048 Размер выходного размера 768 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Не поддерживается |
Последнее обновление | декабрь 2023 г. |
АКА
Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, которые основаны на предоставленных источниках, наряду с оценкой ответственной вероятности.
Детали модели
Свойство | Описание |
---|---|
Код модели | models/aqa |
Поддерживаемые типы данных | Вход Текст Выход Текст |
Поддерживаемый язык | Английский |
[*] | Лимиты токеновЛимит входных токенов 7,168 Лимит выходных токенов 1024 |
[**] | Ограничения скорости1500 запросов в минуту |
Регулируемые настройки безопасности | Поддерживается |
Последнее обновление | декабрь 2023 г. |
См. Примеры для изучения возможностей этих изменений модели.
[*] Токен эквивалентен примерно 4 символам для моделей Близнецов. 100 токенов — это примерно 60-80 английских слов.
[**] Число запросов в минуту: количество запросов в минуту.
TPM: токенов в минуту
RPD: запросов в день
TPD: токенов в день
Из -за ограничений емкости указанные максимальные ограничения скорости не гарантируются.
Шаблоны названий версий моделей
Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.
Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.
Чтобы указать последнюю версию, используйте следующий шаблон:
<model>-<generation>-<variation>-latest
. Например,gemini-1.0-pro-latest
.Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.
Чтобы указать последнюю стабильную версию, используйте следующий шаблон:
<model>-<generation>-<variation>
> . Например,gemini-1.0-pro
.Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.
Чтобы указать стабильную версию, используйте следующий шаблон:
<model>-<generation>-<variation>-<version>
> . Например,gemini-1.0-pro-001
.Экспериментальная модель. Указывает на экспериментальную модель, доступную в предварительной версии, как определено в Условиях , что означает, что она не предназначена для промышленного использования. Мы выпускаем экспериментальные модели, чтобы собрать отзывы, быстро передать последние обновления разработчикам и подчеркнуть темпы инноваций, происходящих в Google. То, что мы узнаем из экспериментальных запусков, поможет нам выпускать модели более широко. Экспериментальная модель может быть заменена на другую без предварительного уведомления. Мы не гарантируем, что экспериментальная модель станет стабильной в будущем.
Чтобы указать экспериментальную версию, используйте следующий шаблон:
<model>-<generation>-<variation>-<version>
> . Например,gemini-exp-1121
.
Доступные языки
Модели Gemini обучены работе со следующими языками:
- арабский (
ar
) - Бенгальский (
bn
) - Болгарский (
bg
) - Китайский упрощенный и традиционный (
zh
) - Хорватский (
hr
) - Чешский (
cs
) - датский (
da
) - Dutch (
nl
) - английский (
en
) - Эстонский (
et
) - финский (
fi
) - французский (
fr
.) - немецкий (
de
) - Греческий (
el
) - Иврит (
iw
) - Хинди (
hi
) - венгерский (
hu
) - Индонезийский (
id
) - Итальянский (
it
) - японский (
ja
) - Корейский (
ko
) - Латышский (
lv
.) - Литовский (
lt
) - Норвежский (
no
) - польский (
pl
) - Португальский (
pt
) - Румынский (
ro
) - Русский (
ru
) - Сербский (
sr
) - словацкий (
sk
) - Словенский (
sl
) - Испанский (
es
) - Суахили (
sw
.) - Шведский (
sv
) - Тайский (
th
) - турецкий (
tr
) - Украинский (
uk
) - Вьетнамский (
vi
)