Funkcja wykonywania kodu interfejsu Gemini API umożliwia modelowi generowanie i uruchamianie kodu Pythona oraz iteracyjne uczenie się na podstawie wyników, aż do uzyskania ostatecznego wyniku. Możesz użyć tej funkcji do tworzenia aplikacji, które korzystają z rozpoznawania tekstu opartego na kodzie i generują tekst. Możesz na przykład użyć wykonania kodu w aplikacji, która rozwiązuje równania lub przetwarza tekst.
Wykonywanie kodu jest dostępne zarówno w AI Studio, jak i w Gemini API. W AI Studio możesz włączyć wykonywanie kodu w sekcji Ustawienia zaawansowane. Gemini API zapewnia wykonywanie kodu jako narzędzie podobne do wywołania funkcji. Po dodaniu wykonywania kodu jako narzędzia model sam decyduje, kiedy ma go użyć.
Pierwsze kroki z wykonywaniem kodu
W tej sekcji zakładamy, że masz już za sobą czynności konfiguracyjne opisane w krótkim wprowadzeniu.
Wykonywanie kodu a wywoływanie funkcji
Wykonywanie kodu i wywoływanie funkcji to podobne funkcje:
- Wykonywanie kodu umożliwia modelowi uruchamianie kodu w backendzie interfejsu API w stałym, izolowanym środowisku.
- Wywoływanie funkcji umożliwia uruchamianie funkcji, których potrzebuje model, w dowolnym środowisku.
Ogólnie zalecamy użycie uruchomienia kodu, jeśli jest ono odpowiednie do Twojego przypadku użycia. Wykonywanie kodu jest łatwiejsze w użyciu (wystarczy je włączyć) i sprowadza się do wysłania jednego żądania GenerateContent
(więc powoduje tylko jedno obciążenie). Wywoływanie funkcji wymaga wysłania dodatkowego żądania GenerateContent
, aby przesłać dane wyjściowe z każdego wywołania funkcji (co powoduje dodatkowe opłaty).
W większości przypadków, jeśli masz własne funkcje, które chcesz uruchomić lokalnie, powinieneś użyć wywołania funkcji. Jeśli chcesz, aby interfejs API napisał i uruchomił za Ciebie kod Pythona, a potem zwrócił wynik, powinieneś użyć wykonania kodu.
Płatności
Włączenie wykonywania kodu z interfejsu Gemini API nie wiąże się z dodatkowymi opłatami. Będziesz obciążany(-a) opłatą według bieżącej stawki tokenów wejściowych i wyjściowych.
Oto kilka innych informacji o płatnościach za wykonywanie kodu:
- Naliczamy opłatę tylko raz za tokeny wejściowe przekazywane do modelu. Naliczamy też opłatę za ostateczne tokeny wyjściowe zwracane przez model.
- Tokeny reprezentujące wygenerowany kod są zliczane jako tokeny wyjściowe.
- Wyniki wykonania kodu są również liczone jako tokeny wyjściowe.
Ograniczenia
- Model może tylko generować i wykonywać kod. Nie może zwracać innych artefaktów, takich jak pliki multimedialne.
- Ta funkcja nie obsługuje operacji wejścia/wyjścia dotyczących plików ani przypadków użycia, które obejmują dane wyjściowe inne niż tekstowe (np. wykresy danych czy przesyłanie plików CSV).
- Wykonywanie kodu może trwać maksymalnie 30 sekund przed przekroczeniem limitu czasu.
- W niektórych przypadkach włączenie wykonywania kodu może spowodować regresję w innych obszarach danych wyjściowych modelu (np. w pisaniu historii).
- Różne modele mają nieco inne możliwości korzystania z wykonywania kodu. Na podstawie naszych testów model Gemini 1.5 Pro jest najbardziej wydajny.