Generowanie danych wyjściowych JSON za pomocą interfejsu Gemini API


Gemini domyślnie generuje nieuporządkowany tekst, ale niektóre aplikacje wymagają tekstu uporządkowanego. W tych przypadkach możesz ograniczyć działanie Gemini do reagowania za pomocą JSON – format uporządkowanych danych odpowiedni do automatycznego przetwarzania.

Na przykład w tych przypadkach użycia wymagane są uporządkowane dane wyjściowe z modelu:

  • Zbuduj bazę danych firm, pobierając informacje o firmie artykułów prasowych.
  • Pobieraj ujednolicone informacje ze CV.
  • Wyodrębnij składniki z przepisów i wyświetlaj link do witryny spożywczej każdy składnik.

W prompcie możesz poprosić Gemini o utworzenie danych wyjściowych w formacie JSON, ale pamiętaj, że Google nie może zagwarantować, że utworzy plik JSON, w którym tylko JSON. Jeśli jednak używasz Gemini 1.5 Pro, możesz przekazać określony schemat JSON w responseSchema dzięki czemu Gemini zawsze odpowiada oczekiwaną strukturę.

Z tego przewodnika dowiesz się, jak wygenerować plik JSON za pomocą metody generateContent za pomocą pakietu SDK przez Ciebie wybrane. Skupia się na tekście, chociaż Gemini może też generować Odpowiedzi JSON na żądania multimodalne, które zawierają obrazy, filmy oraz dźwięk.