Руководство по встраиванию

Служба встраивания в Gemini API генерирует современные встраивания для слов, фраз и предложений. Полученные вложения затем можно использовать для задач НЛП, таких как семантический поиск, классификация текста и кластеризация, а также многие другие. На этой странице описывается, что такое внедрение, и освещаются некоторые ключевые варианты использования службы внедрения, которые помогут вам начать работу.

Что такое вложения?

Встраивание текста — это метод обработки естественного языка (NLP), который преобразует текст в числовые векторы. Вложения улавливают семантическое значение и контекст, в результате чего текст со схожим значением имеет более близкие вложения. Например, предложения «Я отвез свою собаку к ветеринару» и «Я отвез свою кошку к ветеринару» будут иметь вложения, близкие друг к другу в векторном пространстве, поскольку оба они описывают схожий контекст.

Это важно, поскольку открывает доступ ко многим алгоритмам, которые могут работать с векторами, но не непосредственно с текстом.

Вы можете использовать эти вложения или векторы, чтобы сравнивать разные тексты и понимать, как они связаны. Например, если вложения текста «кошка» и «собака» расположены близко друг к другу, вы можете сделать вывод, что эти слова схожи по значению или контексту, или и то, и другое. Эта возможность позволяет использовать различные варианты использования, описанные в следующем разделе.

Случаи использования

Встраивание текста обеспечивает множество вариантов использования НЛП. Например:

Упругие вложения

Модель Gemini Text Embedding, начиная с text-embedding-004 , предлагает эластичные размеры внедрения до 768. Вы можете использовать эластичные внедрения для создания меньших размеров вывода и потенциально сэкономить затраты на вычисления и хранение с незначительной потерей производительности.

Что дальше

  • Если вы готовы начать разработку, вы можете найти полный работоспособный код в кратких руководствах по Python , Go , Node.js и Dart (Flutter) .