Wyszukiwanie dokumentów za pomocą wektorów dystrybucyjnych

Ten przykład pokazuje, jak używać interfejsu Gemini API do tworzenia wektorów dystrybucyjnych w celu wyszukiwania dokumentów. Za pomocą biblioteki klienta w języku Python utworzysz wektor dystrybucyjny słów, który umożliwi porównywanie wyszukiwanych ciągów (lub pytań) z zawartością dokumentów.

W tym samouczku za pomocą reprezentacji właściwościowych przeszukasz zbiór dokumentów w celu zadania pytań dotyczących samochodu Google.

Wymagania wstępne

Możesz uruchomić to krótkie wprowadzenie w Google Colab.

Aby ukończyć to krótkie wprowadzenie we własnym środowisku programistycznym, sprawdź, czy środowisko spełnia te wymagania:

  • Python w wersji 3.9 lub nowszej
  • Instalacja programu jupyter w celu uruchomienia notatnika.


Najpierw pobierz i zainstaluj bibliotekę Pythona Gemini API.

pip install -U -q google.generativeai
import textwrap
import numpy as np
import pandas as pd

import google.generativeai as genai

# Used to securely store your API key
from google.colab import userdata

from IPython.display import Markdown

Pobierz klucz interfejsu API

Aby móc korzystać z Gemini API, musisz najpierw uzyskać klucz API. Jeśli nie masz jeszcze klucza, utwórz go jednym kliknięciem w Google AI Studio.

Uzyskiwanie klucza interfejsu API

W Colab dodaj klucz do menedżera obiektów tajnych w sekcji „🔑” w panelu po lewej stronie. Nazwij go API_KEY.

Po uzyskaniu klucza interfejsu API przekaż go do pakietu SDK. Można to zrobić na dwa sposoby:

  • Umieść ten klucz w zmiennej środowiskowej GOOGLE_API_KEY (pakiet SDK automatycznie go stamtąd pobierze).
  • Przekaż klucz urządzeniu genai.configure(api_key=...)
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:

Generowanie wektora dystrybucyjnego

W tej sekcji dowiesz się, jak wygenerować wektory dystrybucyjne dla fragmentu tekstu przy użyciu wektorów dystrybucyjnych z Gemini API.

Zmiany w interfejsie API dotyczące reprezentacji właściwościowych z osadzeniem modelu 001

W nowym modelu wektorów dystrybucyjnych – wektora dystrybucyjnego 001 dostępny jest nowy parametr typu zadania i opcjonalny tytuł (tylko w przypadku parametru event_type=RETRIEVAL_DOCUMENT).

Te nowe parametry mają zastosowanie tylko do najnowszych modeli wektorów dystrybucyjnych.Typy zadań to:

Typ zadania Opis
RETRIEVAL_QUERY Określa, że dany tekst jest zapytaniem w ustawieniach wyszukiwania/pobierania.
RETRIEVAL_DOCUMENT Określa, że dany tekst jest dokumentem w ustawieniu wyszukiwania/pobierania.
SEMANTIC_SIMILARITY Określa, który tekst będzie używany na potrzeby funkcji podobieństwo semantycznego (STS).
KLASYFIKACJA Określa, że wektory dystrybucyjne będą używane do klasyfikacji.
KLASTEROWANIE Określa, że wektory dystrybucyjne będą używane do grupowania.
title = "The next generation of AI for developers and Google Workspace"
sample_text = ("Title: The next generation of AI for developers and Google Workspace"
    "Full article:\n"
    "Gemini API & Google AI Studio: An approachable way to explore and prototype with generative AI applications")

model = 'models/embedding-001'
embedding = genai.embed_content(model=model,

Tworzenie bazy danych wektorów dystrybucyjnych

Poniżej znajdziesz 3 przykładowe teksty, które możesz wykorzystać do utworzenia bazy danych wektorów dystrybucyjnych. Interfejs Gemini API służy do tworzenia wektorów dystrybucyjnych każdego z dokumentów. Przekształć je w ramkę danych, aby uzyskać lepszą wizualizację.

    "title": "Operating the Climate Control System",
    "content": "Your Googlecar has a climate control system that allows you to adjust the temperature and airflow in the car. To operate the climate control system, use the buttons and knobs located on the center console.  Temperature: The temperature knob controls the temperature inside the car. Turn the knob clockwise to increase the temperature or counterclockwise to decrease the temperature. Airflow: The airflow knob controls the amount of airflow inside the car. Turn the knob clockwise to increase the airflow or counterclockwise to decrease the airflow. Fan speed: The fan speed knob controls the speed of the fan. Turn the knob clockwise to increase the fan speed or counterclockwise to decrease the fan speed. Mode: The mode button allows you to select the desired mode. The available modes are: Auto: The car will automatically adjust the temperature and airflow to maintain a comfortable level. Cool: The car will blow cool air into the car. Heat: The car will blow warm air into the car. Defrost: The car will blow warm air onto the windshield to defrost it."}
    "title": "Touchscreen",
    "content": "Your Googlecar has a large touchscreen display that provides access to a variety of features, including navigation, entertainment, and climate control. To use the touchscreen display, simply touch the desired icon.  For example, you can touch the \"Navigation\" icon to get directions to your destination or touch the \"Music\" icon to play your favorite songs."}
    "title": "Shifting Gears",
    "content": "Your Googlecar has an automatic transmission. To shift gears, simply move the shift lever to the desired position.  Park: This position is used when you are parked. The wheels are locked and the car cannot move. Reverse: This position is used to back up. Neutral: This position is used when you are stopped at a light or in traffic. The car is not in gear and will not move unless you press the gas pedal. Drive: This position is used to drive forward. Low: This position is used for driving in snow or other slippery conditions."}


Uporządkuj zawartość słownika w ramkę danych, aby uzyskać lepszą wizualizację.

df = pd.DataFrame(documents)
df.columns = ['Title', 'Text']

Pobierz wektory dystrybucyjne dla każdego z tych treści tekstu. Dodaj tę informację do ramki DataFrame.

# Get the embeddings of each text and add to an embeddings column in the dataframe
def embed_fn(title, text):
  return genai.embed_content(model=model,

df['Embeddings'] = df.apply(lambda row: embed_fn(row['Title'], row['Text']), axis=1)

Wyszukiwanie dokumentów za pomocą sesji pytań i odpowiedzi

Wektory dystrybucyjne zostały wygenerowane, czas więc utworzyć system pytań i odpowiedzi do przeszukiwania tych dokumentów. Zadasz pytanie na temat dostrajania hiperparametrów, utworzysz jego wektory dystrybucyjne i porównasz je ze zbiorem wektorów dystrybucyjnych w ramce DataFrame.

Osadzenie pytania ma postać wektora (listy wartości zmiennoprzecinkowych), który zostanie porównany z wektorem dokumentów przy użyciu iloczynu skalarnego. Ten wektor zwrócony z interfejsu API został już znormalizowany. Iloczyn skalarny reprezentuje podobieństwo kierunku między dwoma wektorami.

Wartości iloczynu skalarnego mogą się mieścić w zakresie od -1 do 1 włącznie. Jeśli iloczyn skalarny między dwoma wektorami wynosi 1, wektory są w tym samym kierunku. Jeśli wartość iloczynu skalarnego wynosi 0, to wektory są ortogonalne lub niepowiązane ze sobą. I wreszcie, jeśli iloczyn skalarny wynosi -1, to wektory wskazują przeciwny kierunek i nie są do siebie podobne.

Pamiętaj, że w nowym modelu wektorów dystrybucyjnych (embedding-001) określ typ zadania jako QUERY w przypadku zapytania użytkownika i DOCUMENT w przypadku umieszczania tekstu dokumentu.

Typ zadania Opis
RETRIEVAL_QUERY Określa, że dany tekst jest zapytaniem w ustawieniach wyszukiwania/pobierania.
RETRIEVAL_DOCUMENT Określa, że dany tekst jest dokumentem w ustawieniu wyszukiwania/pobierania.
query = "How do you shift gears in the Google car?"
model = 'models/embedding-001'

request = genai.embed_content(model=model,

Użyj funkcji find_best_passage, aby obliczyć iloczyn skalarny, a następnie posortuj dane w ramce DataFrame od największej do najmniejszej wartości iloczynu skalarnego, aby pobrać odpowiedni fragment z bazy danych.

def find_best_passage(query, dataframe):
  Compute the distances between the query and each document in the dataframe
  using the dot product.
  query_embedding = genai.embed_content(model=model,
  dot_products = np.dot(np.stack(dataframe['Embeddings']), query_embedding["embedding"])
  idx = np.argmax(dot_products)
  return dataframe.iloc[idx]['Text'] # Return text from index with max value

Wyświetl najtrafniejszy dokument z bazy danych:

passage = find_best_passage(query, df)
'Shifting Gears  Your Googlecar has an automatic transmission. To shift gears, simply move the shift lever to the desired position.  Park: This position is used when you are parked. The wheels are locked and the car cannot move. Reverse: This position is used to back up. Neutral: This position is used when you are stopped at a light or in traffic. The car is not in gear and will not move unless you press the gas pedal. Drive: This position is used to drive forward. Low: This position is used for driving in snow or other slippery conditions.'

Aplikacja do pytań i odpowiedzi

Spróbujmy użyć interfejsu API do generowania tekstu, aby utworzyć pytania i System. Wpisz poniżej własne dane niestandardowe, aby utworzyć proste pytanie i przykładową odpowiedź. Iloczyn skalarny nadal będzie używany jako wskaźnik podobieństwa.

def make_prompt(query, relevant_passage):
  escaped = relevant_passage.replace("'", "").replace('"', "").replace("\n", " ")
  prompt = textwrap.dedent("""You are a helpful and informative bot that answers questions using text from the reference passage included below. \
  Be sure to respond in a complete sentence, being comprehensive, including all relevant background information. \
  However, you are talking to a non-technical audience, so be sure to break down complicated concepts and \
  strike a friendly and converstional tone. \
  If the passage is irrelevant to the answer, you may ignore it.
  QUESTION: '{query}'
  PASSAGE: '{relevant_passage}'

  """).format(query=query, relevant_passage=escaped)

  return prompt
prompt = make_prompt(query, passage)
You are a helpful and informative bot that answers questions using text from the reference passage included below.   Be sure to respond in a complete sentence, being comprehensive, including all relevant background information.   However, you are talking to a non-technical audience, so be sure to break down complicated concepts and   strike a friendly and converstional tone.   If the passage is irrelevant to the answer, you may ignore it.
  QUESTION: 'How do you shift gears in the Google car?'
  PASSAGE: 'Shifting Gears  Your Googlecar has an automatic transmission. To shift gears, simply move the shift lever to the desired position.  Park: This position is used when you are parked. The wheels are locked and the car cannot move. Reverse: This position is used to back up. Neutral: This position is used when you are stopped at a light or in traffic. The car is not in gear and will not move unless you press the gas pedal. Drive: This position is used to drive forward. Low: This position is used for driving in snow or other slippery conditions.'


Wybierz 1 z modeli generowania treści w Gemini, aby znaleźć odpowiedź na swoje zapytanie.

for m in genai.list_models():
  if 'generateContent' in m.supported_generation_methods:
model = genai.GenerativeModel('gemini-1.5-pro-latest')
answer = model.generate_content(prompt)

Ten fragment nie zawiera informacji o tym, jak przełączać biegi w samochodzie Google, więc nie mogę odpowiedzieć na Twoje pytanie na podstawie tego źródła.

Dalsze kroki

