Generowanie danych wyjściowych JSON za pomocą interfejsu Gemini API


Gemini domyślnie generuje tekst nieuporządkowany, ale niektóre aplikacje wymagają tekstu uporządkowanego. W tych przypadkach możesz ograniczyć działanie Gemini do udzielania odpowiedzi za pomocą JSON – uporządkowanych danych odpowiednich do automatycznego przetwarzania.

Na przykład w tych przypadkach użycia wymagane są uporządkowane dane wyjściowe z modelu:

  • Zbudowanie bazy danych firm, pobierając informacje z artykułów prasowych.
  • Pobieraj ujednolicone informacje ze CV.
  • Wyodrębnij składniki z przepisów i w przypadku każdego składnika wyświetl link do witryny sklepu spożywczego.

Możesz poprosić Gemini o utworzenie danych wyjściowych w formacie JSON. Pamiętaj jednak, że Google nie może zagwarantować, że wygeneruje to JSON, a nie tylko JSON. Jeśli jednak używasz Gemini 1.5 Pro, możesz przekazać określony schemat JSON w polu response_schema, dzięki czemu Gemini zawsze odpowiada oczekiwaną strukturę.

Z tego przewodnika dowiesz się, jak wygenerować plik JSON za pomocą metody generateContent za pomocą wybranego pakietu SDK. Skupia się na danych wejściowych, ale Gemini może również generować odpowiedzi JSON na zapytania multimodalne. Więcej informacji o multimodalnych promptach z plikami wideo i audio znajdziesz w artykule Wyświetlanie promptów przy użyciu plików multimedialnych.