Wykonanie kodu

Funkcja wykonywania kodu interfejsu Gemini API umożliwia modelowi generowanie i uruchamianie kodu Pythona oraz iteracyjne uczenie się na podstawie wyników, aż do uzyskania ostatecznego wyniku. Możesz użyć tej funkcji do tworzenia aplikacji, które korzystają z rozpoznawania tekstu opartego na kodzie i generują tekst. Możesz na przykład użyć wykonania kodu w aplikacji, która rozwiązuje równania lub przetwarza tekst.

Wykonywanie kodu jest dostępne zarówno w AI Studio, jak i w Gemini API. W AI Studio możesz włączyć wykonywanie kodu w sekcji Ustawienia zaawansowane. Gemini API zapewnia wykonywanie kodu jako narzędzie podobne do wywołania funkcji. Po dodaniu wykonywania kodu jako narzędzia model sam decyduje, kiedy ma go użyć.

Pierwsze kroki z wykonywaniem kodu

W tej sekcji zakładamy, że masz już za sobą czynności konfiguracyjne opisane w krótkim wprowadzeniu.

Wykonywanie kodu a wywoływanie funkcji

Wykonywanie kodu i wywoływanie funkcji to podobne funkcje:

  • Wykonywanie kodu umożliwia modelowi uruchamianie kodu w backendzie interfejsu API w stałym, izolowanym środowisku.
  • Wywoływanie funkcji umożliwia uruchamianie funkcji, których potrzebuje model, w dowolnym środowisku.

Ogólnie zalecamy użycie uruchomienia kodu, jeśli jest ono odpowiednie do Twojego przypadku użycia. Wykonywanie kodu jest łatwiejsze w użyciu (wystarczy je włączyć) i sprowadza się do wysłania jednego żądania GenerateContent (więc powoduje tylko jedno obciążenie). Wywoływanie funkcji wymaga wysłania dodatkowego żądania GenerateContent, aby przesłać dane wyjściowe z każdego wywołania funkcji (co powoduje dodatkowe opłaty).

W większości przypadków, jeśli masz własne funkcje, które chcesz uruchomić lokalnie, powinieneś użyć wywołania funkcji. Jeśli chcesz, aby interfejs API napisał i uruchomił za Ciebie kod Pythona, a potem zwrócił wynik, powinieneś użyć wykonania kodu.

Płatności

Włączenie wykonywania kodu z interfejsu Gemini API nie wiąże się z dodatkowymi opłatami. Będziesz obciążany(-a) opłatą według bieżącej stawki tokenów wejściowych i wyjściowych.

Oto kilka innych informacji o płatnościach za wykonywanie kodu:

  • Naliczamy opłatę tylko raz za tokeny wejściowe przekazywane do modelu. Naliczamy też opłatę za ostateczne tokeny wyjściowe zwracane przez model.
  • Tokeny reprezentujące wygenerowany kod są zliczane jako tokeny wyjściowe.
  • Wyniki wykonania kodu są również liczone jako tokeny wyjściowe.

Ograniczenia

  • Model może tylko generować i wykonywać kod. Nie może zwracać innych artefaktów, takich jak pliki multimedialne.
  • Ta funkcja nie obsługuje operacji wejścia/wyjścia dotyczących plików ani przypadków użycia, które obejmują dane wyjściowe inne niż tekstowe (np. wykresy danych czy przesyłanie plików CSV).
  • Wykonywanie kodu może trwać maksymalnie 30 sekund przed przekroczeniem limitu czasu.
  • W niektórych przypadkach włączenie wykonywania kodu może spowodować regresję w innych obszarach danych wyjściowych modelu (np. w pisaniu historii).
  • Różne modele mają nieco inne możliwości korzystania z wykonywania kodu. Na podstawie naszych testów model Gemini 1.5 Pro jest najbardziej wydajny.