- Żądanie HTTP
- Parametry ścieżki
- Treść żądania
- Treść odpowiedzi
- Zakresy autoryzacji
- GenerateContentRequest
Uruchamia tokenizację modelu w przypadku treści wejściowej i zwraca liczbę tokenów.
Żądanie HTTP
POST https://generativelanguage.googleapis.com/v1beta/{model=models/*}:countTokens
Adres URL używa składni transkodowania gRPC.
Parametry ścieżki
Parametry | |
---|---|
model |
Wymagane. Nazwa zasobu modelu. Służy on jako identyfikator, którego model ma używać. Ta nazwa powinna być zgodna z nazwą modelu zwracaną przez metodę Format: |
Treść żądania
Treść żądania zawiera dane o następującej strukturze:
Zapis JSON |
---|
{ "contents": [ { object ( |
Pola | |
---|---|
contents[] |
Opcjonalnie. Dane wejściowe podane modelowi w postaci promptu. To pole jest ignorowane po ustawieniu pola |
generateContentRequest |
Opcjonalnie. Ogólne dane wejściowe podane modelowi. Models.countTokens zlicza prompty, wywołania funkcji itp. |
Treść odpowiedzi
Odpowiedź od użytkownika models.countTokens
.
Zwraca tokenCount
modelu dla prompt
.
W przypadku powodzenia treść żądania zawiera dane o następującej strukturze:
Zapis JSON |
---|
{ "totalTokens": integer } |
Pola | |
---|---|
totalTokens |
Liczba tokenów, do których Zawsze nieujemna. Jeśli ustawiona jest treść w pamięci podręcznej, nadal jest to łączny efektywny rozmiar promptu. Oznacza to, że obejmuje to liczbę tokenów w pamięci podręcznej. |
Zakresy autoryzacji
Wymaga jednego z tych zakresów protokołu OAuth:
https://www.googleapis.com/auth/generative-language
https://www.googleapis.com/auth/generative-language.tuning
https://www.googleapis.com/auth/generative-language.tuning.readonly
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/generative-language.retriever.readonly
Więcej informacji znajdziesz w artykule o uwierzytelnianiu (w języku angielskim).
GenerateContentRequest
Żądanie wygenerowania ukończenia z modelu.
Zapis JSON |
---|
{ "model": string, "contents": [ { object ( |
Pola | |
---|---|
model |
Wymagane. Nazwa elementu Format: |
contents[] |
Wymagane. Treść bieżącej rozmowy z modelem. W przypadku zapytań jednoetapowych jest to pojedyncza instancja. W przypadku zapytań wieloetapowych jest to pole powtarzane, które zawiera historię rozmowy i ostatnie żądanie. |
tools[] |
Opcjonalnie. Lista właściwości
|
toolConfig |
Opcjonalnie. Konfiguracja narzędzia dla dowolnych |
safetySettings[] |
Opcjonalnie. Lista unikalnych instancji Ta zmiana zostanie zastosowana w |
systemInstruction |
Opcjonalnie. Instrukcja systemowa ustawiona przez dewelopera. Obecnie tylko tekstowe. |
generationConfig |
Opcjonalnie. Opcje konfiguracji generowania modeli i ich danych wyjściowych. |
cachedContent |
Opcjonalnie. Nazwa treści z pamięci podręcznej używanej jako kontekst do wyświetlania podpowiedzi. Uwaga: używane tylko w trybie jawnego buforowania, w którym użytkownicy mogą kontrolować buforowanie (np. jaką zawartość przechowywać w pamięci podręcznej) i korzystać z gwarantowanych oszczędności. Format: |