Gemini 2.0 Flash 사고 모드는 모델이 응답의 일부로 거치는 '사고 과정'을 생성하도록 학습된 실험용 모델입니다. 따라서 사고 모드는 기본 Gemini 2.0 Flash 모델보다 더 강력한 추론 기능을 제공할 수 있습니다.
사고 모드 사용
사고 모드는 Google AI Studio에서 실험용 모델로 사용할 수 있으며 Gemini API에서 직접 사용할 수 있습니다.
Gemini API
Gemini API를 호출할 때 모델 코드를 지정합니다. 예를 들면 다음과 같습니다.
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)
gemini-2.0-flash-thinking-exp
또는 gemini-2.0-flash-thinking-exp-1219
를 모델 코드로 사용할 수 있습니다.
Google AI Studio
설정 창의 모델 드롭다운 메뉴에서 Gemini 2.0 Flash Thinking Experimental 모델을 선택합니다.
생각
모델의 생각을 반환하는 방법은 Gemini API를 직접 사용하는지 또는 Google AI Studio를 통해 요청하는지에 따라 다릅니다.
Gemini API
모델의 사고 과정은 모델이 응답을 생성할 때 생성되는 content.parts
목록의 첫 번째 요소로 반환됩니다. 예를 들어 다음 코드는 모델의 사고 과정만 출력합니다.
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)
Markdown(response.candidates[0].content.parts[0].text)
Colab 노트북에서 Gemini API를 사용하여 생각 모드를 사용하는 방법의 추가 예시를 확인할 수 있습니다.
Google AI Studio
모델의 사고 과정은 응답 창의 생각 패널에 새 섹션으로 반환됩니다.
기본적으로 생각 패널은 접혀 있습니다. 의견 헤더를 클릭하여 패널을 펼칠 수 있습니다.
반환된 응답과 달리 생각 패널의 콘텐츠는 Google AI 스튜디오에서 수정할 수 없습니다.
제한사항
생각 모드는 실험용 모델이며 다음과 같은 제한사항이 있습니다.
- 32k 토큰 입력 한도
- 텍스트 및 이미지 입력만
- 8k 토큰 출력 한도
- 텍스트 전용 출력
- 검색이나 코드 실행과 같은 기본 제공 도구 사용 불가
다음 단계
Colab 노트북을 사용하여 직접 생각 모드를 사용해 보거나 Google AI Studio를 열고 직접 모델에 프롬프트를 제공해 보세요.