Generuje odpowiedź z modelu na podstawie komunikatu wejściowego.
Żądanie HTTP
POST https://generativelanguage.googleapis.com/v1beta/{model=models/*}:generateText
Adres URL używa składni transkodowania gRPC.
Parametry ścieżki
Parametry | |
---|---|
model |
To pole jest wymagane. Nazwa zasobu |
Treść żądania
Treść żądania zawiera dane o następującej strukturze:
Zapis JSON |
---|
{ "prompt": { object ( |
Pola | |
---|---|
prompt |
To pole jest wymagane. Swobodny tekst wejściowy przekazywany modelowi jako prompt. Po sygnalizowaniu promptu model wygeneruje odpowiedź tekstową, która będzie przewidziana jako zakończenie tekstu wejściowego. |
safetySettings[] |
Opcjonalnie. Lista unikalnych instancji które będą egzekwowane w |
stopSequences[] |
Zestaw sekwencji znaków (maksymalnie 5), które zatrzymują generowanie danych wyjściowych. Jeśli zostanie określony, interfejs API zostanie zatrzymany przy pierwszym wystąpieniu sekwencji zatrzymania. Sekwencja zatrzymania nie będzie częścią odpowiedzi. |
temperature |
Opcjonalnie. Określa losowość danych wyjściowych. Uwaga: wartość domyślna różni się w zależności od modelu. Zobacz atrybut Wartości mieszczą się w zakresie od [0,0, 1,0] włącznie. Wartość bliższa 1,0 daje odpowiedzi bardziej zróżnicowane i kreatywne, natomiast wartość bliższa 0,0 zazwyczaj oznacza bardziej bezpośrednie odpowiedzi modelu. |
candidateCount |
Opcjonalnie. Liczba wygenerowanych odpowiedzi do zwrócenia. Ta wartość musi mieścić się w przedziale od [1, 8] włącznie. Jeśli zasada jest nieskonfigurowana, domyślnie przyjmuje wartość 1. |
maxOutputTokens |
Opcjonalnie. Maksymalna liczba tokenów do uwzględnienia w kandydacie. Jeśli zasada jest nieskonfigurowana, domyślnie przyjmuje wartośćoutputTokenLimit określony w specyfikacji |
topP |
Opcjonalnie. Maksymalne skumulowane prawdopodobieństwo, które tokeny należy wziąć pod uwagę podczas próbkowania. Model wykorzystuje połączone próbkowanie górnego K i próbkowanie jądra. Tokeny są sortowane na podstawie przypisanych do nich prawdopodobieństw, więc uwzględniane są tylko te z nich, które są najbardziej prawdopodobne. Próbkowanie górnego K bezpośrednio ogranicza maksymalną liczbę tokenów do rozważenia, a próbkowanie Nucleus ogranicza liczbę tokenów na podstawie skumulowanego prawdopodobieństwa. Uwaga: wartość domyślna różni się w zależności od modelu. Zobacz atrybut |
topK |
Opcjonalnie. Maksymalna liczba tokenów uwzględniana podczas próbkowania. Model wykorzystuje połączone próbkowanie górnego K i próbkowanie jądra. Próbkowanie górnego K uwzględnia zbiór Uwaga: wartość domyślna różni się w zależności od modelu. Zobacz atrybut |
Treść odpowiedzi
W przypadku powodzenia treść odpowiedzi obejmuje wystąpienie elementu GenerateTextResponse
.
Zakresy autoryzacji
Wymaga jednego z tych zakresów OAuth:
https://www.googleapis.com/auth/generative-language
https://www.googleapis.com/auth/generative-language.tuning
https://www.googleapis.com/auth/generative-language.tuning.readonly
https://www.googleapis.com/auth/generative-language.retriever
https://www.googleapis.com/auth/generative-language.retriever.readonly
Więcej informacji znajdziesz w artykule Omówienie uwierzytelniania.