Gemini 1.5 Flash 가격 인하, 모든 개발자를 위한 액세스 세부 조정 등
자세히 알아보기
의견 보내기
컨텍스트 캐싱
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
<ph type="x-smartling-placeholder"></ph>
Python
Node.js
이동
일반적인 AI 워크플로에서는 동일한 입력 토큰을
모델입니다. Gemini API 컨텍스트 캐싱 기능을 사용하여 일부 콘텐츠를
입력 토큰을 캐시하고 캐시된 토큰을 참조한 다음
후속 요청에 사용할 수 있습니다. 특정 볼륨에서는 캐시된 토큰을 사용하면 비용이 저렴함
훨씬 더 효율적입니다
토큰 세트를 캐시할 때 토큰 세트를 캐시할 기간을 선택할 수 있습니다.
존재할 수도 있습니다 이 캐싱 기간은
TTL (수명) 이라고 합니다. 설정하지 않으면 TTL 기본값은 1시간입니다. 이
캐싱 비용은 입력 토큰 크기와
유지될 수 있습니다
컨텍스트 캐싱은 Gemini 1.5 Pro와 Gemini 1.5 Flash를 모두 지원합니다.
참고: 컨텍스트 캐싱은 수정된 버전이 있는 안정화 모델에서만 사용할 수 있습니다.
(예: gemini-1.5-pro-001
). 버전 접미사를 포함해야 합니다(
gemini-1.5-pro-001
의 -001
).
컨텍스트 캐싱을 사용해야 하는 경우
컨텍스트 캐싱은 특히 메모리에 상당한 양의 데이터가 있는
초기 컨텍스트는 더 짧은 요청에서 반복적으로 참조됩니다. 다음과 같은 방법을 사용해 보세요.
다음과 같은 사용 사례를 위한 컨텍스트 캐싱:
광범위한 시스템 안내 가 포함된 챗봇
긴 동영상 파일에 대한 반복적인 분석
대규모 문서 집합에 대한 반복 쿼리
빈번한 코드 저장소 분석 또는 버그 수정
캐싱으로 비용이 절감되는 방식
컨텍스트 캐싱은 전체 운영 비용을 절감하도록 설계된 유료 기능입니다.
결제는 다음 요소를 기준으로 합니다.
캐시 토큰 수: 캐시된 입력 토큰의 수입니다.
할인율을 적용받을 수 있습니다.
저장 기간: 캐시된 토큰이 저장되는 시간 (TTL)입니다.
캐시된 토큰 개수의 TTL 기간에 따라 요금이 청구됩니다. 최소 CPM이 없음
최대 경계를 설정할 수 있습니다
기타 요인: 캐시되지 않은 입력 토큰과 같은 기타 요금이 적용됩니다.
사용할 수 있습니다
최신 가격 책정에 관한 자세한 내용은 Gemini API 가격 책정을 참고하세요.
페이지 를 참조하세요. 토큰을 계산하는 방법은 토큰을 참조하세요.
가이드 를 참조하세요.
컨텍스트 캐싱 사용 방법
이 섹션에서는 Gemini SDK를 설치하고 API를 구성했다고 가정합니다.
키에 표시된 대로 빠른 시작 에 나와 있습니다.
추가 고려사항
컨텍스트 캐싱을 사용할 때 다음 고려사항에 유의하세요.
컨텍스트 캐싱의 최소 입력 토큰 수는 32,768개이며,
최대 는 지정된 모델의 최댓값과 동일합니다. (자세한 내용은
토큰 가이드 를 참조하세요.
모델은 캐시된 토큰과 일반 토큰을 구별하지 않습니다.
입력 토큰입니다. 캐시된 콘텐츠는 단순히 프롬프트의 접두사입니다.
컨텍스트 캐싱에는 특별한 비율이나 사용량 제한이 없습니다. 표준
GenerateContent
에 대한 비율 제한이 적용되며 토큰 한도에는 캐시된 요금이 포함됩니다.
토큰입니다.
캐시된 토큰의 수는 다음에서 usage_metadata
에 반환됩니다.
캐시 서비스의 생성, 가져오기, 나열 작업과
캐시 사용 시 GenerateContent
의견 보내기
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스 에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스 에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책 을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-09-09(UTC)
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"필요한 정보가 없음"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"너무 복잡함/단계 수가 너무 많음"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"오래됨"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"번역 문제"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"샘플/코드 문제"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"기타"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"이해하기 쉬움"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"문제가 해결됨"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"기타"
}]
의견을 전달하고 싶나요?
{"lastModified": "\ucd5c\uc885 \uc5c5\ub370\uc774\ud2b8: 2024-09-09(UTC)"}
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-09-09(UTC)"],[],[]]