Gemini API로 비전 기능 살펴보기
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
Gemini API는 전달된 이미지와 동영상에 대한 추론을 실행할 수 있습니다. 이미지, 일련의 이미지 또는 동영상을 전달하면 Gemini가 다음 작업을 할 수 있습니다.
- 콘텐츠에 관한 설명 또는 질문에 답변
- 콘텐츠를 요약하세요.
- 콘텐츠에서 추론
이 튜토리얼에서는 Gemini API에 이미지 및 동영상 입력을 프롬프트하는 몇 가지 방법을 보여줍니다. 모든 출력은 텍스트 전용입니다.
다음 단계
이 가이드에서는 generateContent
를 사용하고 이미지 및 동영상 입력에서 텍스트 출력을 생성하는 방법을 보여줍니다. 자세한 내용은 다음 리소스를 참고하세요.
- 미디어 파일로 프롬프트 설정: Gemini API는 텍스트, 이미지, 오디오, 동영상 데이터가 포함된 프롬프팅(멀티모달 프롬프팅이라고도 함)을 지원합니다.
- 시스템 안내: 시스템 안내를 사용하면 특정 요구사항과 사용 사례에 따라 모델의 동작을 조정할 수 있습니다.
- 안전 안내: 생성형 AI 모델이 부정확하거나 편향되거나 불쾌감을 주는 출력 등 예상치 못한 출력을 생성하는 경우도 있습니다. 이러한 출력으로 인한 피해 위험을 최소화하기 위해서는 후처리와 사람의 평가가 필수적입니다.
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-06-26(UTC)
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"필요한 정보가 없음"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"너무 복잡함/단계 수가 너무 많음"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"오래됨"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"번역 문제"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"샘플/코드 문제"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"기타"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"이해하기 쉬움"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"문제가 해결됨"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"기타"
}]