Gemini API로 JSON 출력 생성


Gemini는 기본적으로 구조화되지 않은 텍스트를 생성하지만, 일부 애플리케이션에는 구조화된 텍스트가 필요합니다. 이러한 사용 사례의 경우 Gemini가 자동 처리에 적합한 구조화된 데이터 형식인 JSON으로 응답하도록 제한할 수 있습니다.

예를 들어 다음 사용 사례에는 모델의 구조화된 출력이 필요합니다.

  • 신문 기사에서 회사 정보를 가져와 회사 데이터베이스를 구축합니다.
  • 이력서에서 표준화된 정보를 가져옵니다.
  • 레시피에서 재료를 추출하고 각 재료에 대한 식료품 웹사이트 링크를 표시합니다.

프롬프트에서 Gemini에게 JSON 형식의 출력을 생성해 달라고 요청할 수 있지만, Google은 JSON을 생성하고 JSON만 생성한다고 보장할 수 없습니다. 그러나 Gemini 1.5 Pro를 사용하는 경우 response_schema 필드에 특정 JSON 스키마를 전달하여 Gemini가 항상 예상된 구조로 응답하도록 할 수 있습니다.

이 가이드에서는 원하는 SDK를 통해 generateContent 메서드를 사용하여 JSON을 생성하는 방법을 보여줍니다. 텍스트 전용 입력에 중점을 두지만 Gemini는 멀티모달 쿼리에 대해 JSON 응답을 생성할 수도 있습니다. 동영상 및 오디오 파일을 사용한 멀티모달 프롬프팅에 관한 자세한 내용은 미디어 파일로 메시지 표시를 참고하세요.