Caching

컨텍스트 캐싱을 사용하면 동일한 미디어 파일에 관해 여러 질문을 하는 경우와 같이 반복적으로 사용하려는 사전 계산된 입력 토큰을 저장하고 재사용할 수 있습니다. 사용량에 따라 비용과 속도를 절약할 수 있습니다. 자세한 내용은 컨텍스트 캐싱 가이드를 참고하세요.

메서드: cachedContents.create

엔드포인트
요청 본문
응답 본문
요청 예시

CachedContent 리소스를 만듭니다.

엔드포인트

post https://generativelanguage.googleapis.com/v1beta/cachedContents

요청 본문

요청 본문에 CachedContent의 인스턴스가 포함됩니다.

필드

contents[] object (Content)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 캐시할 콘텐츠입니다.

tools[] object (Tool)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 모델이 다음 대답을 생성하는 데 사용할 수 있는 Tools 목록

expiration Union type

이 리소스가 만료되는 시점을 지정합니다. expiration는 다음 중 하나여야 합니다.

expireTime string (Timestamp format)

이 리소스가 만료된 것으로 간주되는 시간의 타임스탬프(UTC)입니다. 이 필드는 입력으로 전송된 항목에 관계없이 항상 출력으로 제공됩니다

생성된 출력은 항상 Z-정규화되고 소수점 이하 0, 3, 6 또는 9자리인 RFC 3339를 사용합니다. 'Z' 이외의 오프셋도 허용됩니다. 예를 들면 "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" 또는 "2014-10-02T15:01:23+05:30"입니다.

ttl string (Duration format)

입력 전용입니다. 이 리소스의 새 TTL입니다(입력 전용).

소수점 아래가 최대 9자리까지이고 's'로 끝나는 초 단위 기간입니다. 예를 들면 "3.5s"입니다.

displayName string

선택사항입니다. 변경할 수 없습니다. 캐시된 콘텐츠의 사용자 생성 의미 있는 표시 이름입니다. 최대 128개의 유니코드 문자

model string

필수 항목입니다. 변경할 수 없습니다. 캐시된 콘텐츠에 사용할 Model의 이름입니다. 형식: models/{model}

systemInstruction object (Content)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 개발자가 설정한 시스템 요청 사항입니다. 현재는 텍스트만 지원됩니다.

toolConfig object (ToolConfig)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 도구 구성 이 구성은 모든 도구에서 공유됩니다.

요청 예시

기본

Python

from google import genai
from google.genai import types

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config=types.CreateCachedContentConfig(
        contents=[document],
        system_instruction="You are an expert analyzing transcripts.",
    ),
)
print(cache)

response = client.models.generate_content(
    model=model_name,
    contents="Please summarize this transcript",
    config=types.GenerateContentConfig(cached_content=cache.name),
)
print(response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
console.log("Cache created:", cache);

const response = await ai.models.generateContent({
  model: modelName,
  contents: "Please summarize this transcript",
  config: { cachedContent: cache.name },
});
console.log("Response text:", response.text);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"), 
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}
parts := []*genai.Part{
	genai.NewPartFromURI(document.URI, document.MIMEType),
}
contents := []*genai.Content{
	genai.NewContentFromParts(parts, genai.RoleUser),
}
cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents: contents,
	SystemInstruction: genai.NewContentFromText(
		"You are an expert analyzing transcripts.", genai.RoleUser,
	),
})
if err != nil {
	log.Fatal(err)
}
fmt.Println("Cache created:")
fmt.Println(cache)

// Use the cache for generating content.
response, err := client.Models.GenerateContent(
	ctx,
	modelName,
	genai.Text("Please summarize this transcript"),
	&genai.GenerateContentConfig{
		CachedContent: cache.Name,
	},
)
if err != nil {
	log.Fatal(err)
}
printResponse(response)cache.go

Shell

wget https://storage.googleapis.com/generativeai-downloads/data/a11.txt
echo '{
  "model": "models/gemini-1.5-flash-001",
  "contents":[
    {
      "parts":[
        {
          "inline_data": {
            "mime_type":"text/plain",
            "data": "'$(base64 $B64FLAGS a11.txt)'"
          }
        }
      ],
    "role": "user"
    }
  ],
  "systemInstruction": {
    "parts": [
      {
        "text": "You are an expert at analyzing transcripts."
      }
    ]
  },
  "ttl": "300s"
}' > request.json

curl -X POST "https://generativelanguage.googleapis.com/v1beta/cachedContents?key=$GEMINI_API_KEY" \
 -H 'Content-Type: application/json' \
 -d @request.json \
 > cache.json

CACHE_NAME=$(cat cache.json | grep '"name":' | cut -d '"' -f 4 | head -n 1)

curl -X POST "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-001:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
      "contents": [
        {
          "parts":[{
            "text": "Please summarize this transcript"
          }],
          "role": "user"
        },
      ],
      "cachedContent": "'$CACHE_NAME'"
    }'cache.sh

보낸사람 이름

Python

from google import genai
from google.genai import types

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config=types.CreateCachedContentConfig(
        contents=[document],
        system_instruction="You are an expert analyzing transcripts.",
    ),
)
cache_name = cache.name  # Save the name for later

# Later retrieve the cache
cache = client.caches.get(name=cache_name)
response = client.models.generate_content(
    model=model_name,
    contents="Find a lighthearted moment from this transcript",
    config=types.GenerateContentConfig(cached_content=cache.name),
)
print(response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
const cacheName = cache.name; // Save the name for later

// Later retrieve the cache
const retrievedCache = await ai.caches.get({ name: cacheName });
const response = await ai.models.generateContent({
  model: modelName,
  contents: "Find a lighthearted moment from this transcript",
  config: { cachedContent: retrievedCache.name },
});
console.log("Response text:", response.text);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}
parts := []*genai.Part{
	genai.NewPartFromURI(document.URI, document.MIMEType),
}
contents := []*genai.Content{
	genai.NewContentFromParts(parts, genai.RoleUser),
}
cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents:          contents,
	SystemInstruction: genai.NewContentFromText(
		"You are an expert analyzing transcripts.", genai.RoleUser,
	),
})
if err != nil {
	log.Fatal(err)
}
cacheName := cache.Name

// Later retrieve the cache.
cache, err = client.Caches.Get(ctx, cacheName, &genai.GetCachedContentConfig{})
if err != nil {
	log.Fatal(err)
}

response, err := client.Models.GenerateContent(
	ctx,
	modelName,
	genai.Text("Find a lighthearted moment from this transcript"),
	&genai.GenerateContentConfig{
		CachedContent: cache.Name,
	},
)
if err != nil {
	log.Fatal(err)
}
fmt.Println("Response from cache (create from name):")
printResponse(response)cache.go

채팅에서

Python

from google import genai
from google.genai import types

client = genai.Client()
model_name = "gemini-1.5-flash-001"
system_instruction = "You are an expert analyzing transcripts."

# Create a chat session with the given system instruction.
chat = client.chats.create(
    model=model_name,
    config=types.GenerateContentConfig(system_instruction=system_instruction),
)
document = client.files.upload(file=media / "a11.txt")

response = chat.send_message(
    message=["Hi, could you summarize this transcript?", document]
)
print("\n\nmodel:  ", response.text)
response = chat.send_message(
    message=["Okay, could you tell me more about the trans-lunar injection"]
)
print("\n\nmodel:  ", response.text)

# To cache the conversation so far, pass the chat history as the list of contents.
cache = client.caches.create(
    model=model_name,
    config={
        "contents": chat.get_history(),
        "system_instruction": system_instruction,
    },
)
# Continue the conversation using the cached content.
chat = client.chats.create(
    model=model_name,
    config=types.GenerateContentConfig(cached_content=cache.name),
)
response = chat.send_message(
    message="I didn't understand that last part, could you explain it in simpler language?"
)
print("\n\nmodel:  ", response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const modelName = "gemini-1.5-flash-001";
const systemInstruction = "You are an expert analyzing transcripts.";

// Create a chat session with the system instruction.
const chat = ai.chats.create({
  model: modelName,
  config: { systemInstruction: systemInstruction },
});
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);

let response = await chat.sendMessage({
  message: createUserContent([
    "Hi, could you summarize this transcript?",
    createPartFromUri(document.uri, document.mimeType),
  ]),
});
console.log("\n\nmodel:", response.text);

response = await chat.sendMessage({
  message: "Okay, could you tell me more about the trans-lunar injection",
});
console.log("\n\nmodel:", response.text);

// To cache the conversation so far, pass the chat history as the list of contents.
const chatHistory = chat.getHistory();
const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: chatHistory,
    systemInstruction: systemInstruction,
  },
});

// Continue the conversation using the cached content.
const chatWithCache = ai.chats.create({
  model: modelName,
  config: { cachedContent: cache.name },
});
response = await chatWithCache.sendMessage({
  message:
    "I didn't understand that last part, could you explain it in simpler language?",
});
console.log("\n\nmodel:", response.text);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
systemInstruction := "You are an expert analyzing transcripts."

// Create initial chat with a system instruction.
chat, err := client.Chats.Create(ctx, modelName, &genai.GenerateContentConfig{
	SystemInstruction: genai.NewContentFromText(systemInstruction, genai.RoleUser),
}, nil)
if err != nil {
	log.Fatal(err)
}

document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}

// Send first message with the transcript.
parts := make([]genai.Part, 2)
parts[0] = genai.Part{Text: "Hi, could you summarize this transcript?"}
parts[1] = genai.Part{
	FileData: &genai.FileData{
		FileURI :      document.URI,
		MIMEType: document.MIMEType,
	},
}

// Send chat message.
resp, err := chat.SendMessage(ctx, parts...)
if err != nil {
	log.Fatal(err)
}
fmt.Println("\n\nmodel: ", resp.Text())

resp, err = chat.SendMessage(
	ctx, 
	genai.Part{
		Text: "Okay, could you tell me more about the trans-lunar injection",
	},
)
if err != nil {
	log.Fatal(err)
}
fmt.Println("\n\nmodel: ", resp.Text())

// To cache the conversation so far, pass the chat history as the list of contents.
cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents:          chat.History(false),
	SystemInstruction: genai.NewContentFromText(systemInstruction, genai.RoleUser),
})
if err != nil {
	log.Fatal(err)
}

// Continue the conversation using the cached history.
chat, err = client.Chats.Create(ctx, modelName, &genai.GenerateContentConfig{
	CachedContent: cache.Name,
}, nil)
if err != nil {
	log.Fatal(err)
}

resp, err = chat.SendMessage(
	ctx, 
	genai.Part{
		Text: "I didn't understand that last part, could you explain it in simpler language?",
	},
)
if err != nil {
	log.Fatal(err)
}
fmt.Println("\n\nmodel: ", resp.Text())cache.go

응답 본문

성공한 경우 응답 본문에 새로 생성된 CachedContent의 인스턴스가 포함됩니다.

CachedContents를 나열합니다.

엔드포인트

get https://generativelanguage.googleapis.com/v1beta/cachedContents

쿼리 매개변수

pageSize integer

선택사항입니다. 반환할 캐시된 콘텐츠의 최대 수입니다. 서비스가 이 값보다 더 적게 반환할 수 있습니다. 지정하지 않으면 최대 개수 미만의 기본 항목이 반환됩니다. 최댓값은 1,000이며, 1,000을 초과하는 값은 1,000으로 변환됩니다.

pageToken string

선택사항입니다. 이전 cachedContents.list 호출에서 받은 페이지 토큰입니다. 후속 페이지를 검색하려면 이를 입력합니다.

페이지를 매길 때 cachedContents.list에 제공된 다른 모든 매개변수는 페이지 토큰을 제공한 호출과 일치해야 합니다.

요청 본문

요청 본문은 비어 있어야 합니다.

응답 본문

CachedContents 목록이 포함된 응답입니다.

성공한 경우 응답 본문은 다음과 같은 구조의 데이터를 포함합니다.

필드

cachedContents[] object (CachedContent)

캐시된 콘텐츠 목록입니다.

nextPageToken string

다음 페이지를 검색하기 위해 pageToken으로 전송할 수 있는 토큰입니다. 이 필드를 생략하면 후속 페이지가 표시되지 않습니다.

JSON 표현
{ "cachedContents": [ { object (`CachedContent`) } ], "nextPageToken": string }

메서드: cachedContents.get

엔드포인트
경로 매개변수
요청 본문
응답 본문
요청 예시
- 기본

CachedContent 리소스를 읽습니다.

엔드포인트

get https://generativelanguage.googleapis.com/v1beta/{name=cachedContents/*}

경로 매개변수

name string

필수 항목입니다. 콘텐츠 캐시 항목을 참조하는 리소스 이름입니다. 형식: cachedContents/{id} cachedContents/{cachedcontent} 형식이 사용됩니다.

요청 본문

요청 본문은 비어 있어야 합니다.

요청 예시

Python

from google import genai

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)
print(client.caches.get(name=cache.name))cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
const retrievedCache = await ai.caches.get({ name: cache.name });
console.log("Retrieved Cache:", retrievedCache);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}
parts := []*genai.Part{
	genai.NewPartFromURI(document.URI, document.MIMEType),
}
contents := []*genai.Content{
	genai.NewContentFromParts(parts, genai.RoleUser),
}

cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents:          contents,
	SystemInstruction: genai.NewContentFromText(
		"You are an expert analyzing transcripts.", genai.RoleUser,
	),
})
if err != nil {
	log.Fatal(err)
}

cache, err = client.Caches.Get(ctx, cache.Name, &genai.GetCachedContentConfig{})
if err != nil {
	log.Fatal(err)
}
fmt.Println("Retrieved cache:")
fmt.Println(cache)cache.go

Shell

curl "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY"cache.sh

응답 본문

성공한 경우 응답 본문에 CachedContent의 인스턴스가 포함됩니다.

메서드: cachedContents.patch

엔드포인트
경로 매개변수
쿼리 파라미터
요청 본문
응답 본문
요청 예시
- 기본

CachedContent 리소스를 업데이트합니다 (만료만 업데이트 가능).

엔드포인트

패치 https://generativelanguage.googleapis.com/v1beta/{cachedContent.name=cachedContents/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{cachedContent.name=cachedContents/*}

경로 매개변수

cachedContent.name string

출력 전용입니다. 식별자. 캐시된 콘텐츠를 참조하는 리소스 이름입니다. 형식: cachedContents/{id} cachedContents/{cachedcontent} 형식이 사용됩니다.

쿼리 매개변수

updateMask string (FieldMask format)

업데이트할 필드 목록입니다.

정규화된 필드 이름의 쉼표로 구분된 목록입니다. 예: "user.displayName,photo"

요청 본문

요청 본문에 CachedContent의 인스턴스가 포함됩니다.

필드

expiration Union type

이 리소스가 만료되는 시점을 지정합니다. expiration는 다음 중 하나여야 합니다.

expireTime string (Timestamp format)

이 리소스가 만료된 것으로 간주되는 시간의 타임스탬프(UTC)입니다. 이 필드는 입력으로 전송된 항목에 관계없이 항상 출력으로 제공됩니다

ttl string (Duration format)

입력 전용입니다. 이 리소스의 새 TTL입니다(입력 전용).

소수점 아래가 최대 9자리까지이고 's'로 끝나는 초 단위 기간입니다. 예를 들면 "3.5s"입니다.

요청 예시

Python

from google import genai
from google.genai import types
import datetime

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)

# Update the cache's time-to-live (ttl)
ttl = f"{int(datetime.timedelta(hours=2).total_seconds())}s"
client.caches.update(
    name=cache.name, config=types.UpdateCachedContentConfig(ttl=ttl)
)
print(f"After update:\n {cache}")

# Alternatively, update the expire_time directly
# Update the expire_time directly in valid RFC 3339 format (UTC with a "Z" suffix)
expire_time = (
    (
        datetime.datetime.now(datetime.timezone.utc)
        + datetime.timedelta(minutes=15)
    )
    .isoformat()
    .replace("+00:00", "Z")
)
client.caches.update(
    name=cache.name,
    config=types.UpdateCachedContentConfig(expire_time=expire_time),
)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

let cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});

// Update the cache's time-to-live (ttl)
const ttl = `${2 * 3600}s`; // 2 hours in seconds
cache = await ai.caches.update({
  name: cache.name,
  config: { ttl },
});
console.log("After update (TTL):", cache);

// Alternatively, update the expire_time directly (in RFC 3339 format with a "Z" suffix)
const expireTime = new Date(Date.now() + 15 * 60000)
  .toISOString()
  .replace(/\.\d{3}Z$/, "Z");
cache = await ai.caches.update({
  name: cache.name,
  config: { expireTime: expireTime },
});
console.log("After update (expire_time):", cache);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}
parts := []*genai.Part{
	genai.NewPartFromURI(document.URI, document.MIMEType),
}
contents := []*genai.Content{
	genai.NewContentFromParts(parts, genai.RoleUser),
}

cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents:          contents,
	SystemInstruction: genai.NewContentFromText(
		"You are an expert analyzing transcripts.", genai.RoleUser,
	),
})
if err != nil {
	log.Fatal(err)
}

_, err = client.Caches.Delete(ctx, cache.Name, &genai.DeleteCachedContentConfig{})
if err != nil {
	log.Fatal(err)
}
fmt.Println("Cache deleted:", cache.Name)cache.go

Shell

curl -X PATCH "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY" \
 -H 'Content-Type: application/json' \
 -d '{"ttl": "600s"}'cache.sh

응답 본문

성공한 경우 응답 본문에 CachedContent의 인스턴스가 포함됩니다.

메서드: cachedContents.delete

엔드포인트
경로 매개변수
요청 본문
응답 본문
요청 예시
- 기본

CachedContent 리소스를 삭제합니다.

엔드포인트

delete https://generativelanguage.googleapis.com/v1beta/{name=cachedContents/*}

경로 매개변수

name string

필수 항목입니다. 콘텐츠 캐시 항목을 참조하는 리소스 이름입니다. 형식: cachedContents/{id} cachedContents/{cachedcontent} 형식을 사용합니다.

요청 본문

요청 본문은 비어 있어야 합니다.

요청 예시

Python

from google import genai

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)
client.caches.delete(name=cache.name)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
await ai.caches.delete({ name: cache.name });
console.log("Cache deleted:", cache.name);cache.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelName := "gemini-1.5-flash-001"
document, err := client.Files.UploadFromPath(
	ctx, 
	filepath.Join(getMedia(), "a11.txt"), 
	&genai.UploadFileConfig{
		MIMEType : "text/plain",
	},
)
if err != nil {
	log.Fatal(err)
}
parts := []*genai.Part{
	genai.NewPartFromURI(document.URI, document.MIMEType),
}
contents := []*genai.Content{
	genai.NewContentFromParts(parts, genai.RoleUser),
}

cache, err := client.Caches.Create(ctx, modelName, &genai.CreateCachedContentConfig{
	Contents:          contents,
	SystemInstruction: genai.NewContentFromText(
		"You are an expert analyzing transcripts.", genai.RoleUser,
	),
})
if err != nil {
	log.Fatal(err)
}

_, err = client.Caches.Delete(ctx, cache.Name, &genai.DeleteCachedContentConfig{})
if err != nil {
	log.Fatal(err)
}
fmt.Println("Cache deleted:", cache.Name)cache.go

Shell

curl -X DELETE "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY"cache.sh

응답 본문

성공하면 응답 본문은 빈 JSON 객체입니다.

REST 리소스: cachedContents

리소스: CachedContent
- JSON 표현
콘텐츠
- JSON 표현
파트
- JSON 표현
Blob
- JSON 표현
FunctionCall
- JSON 표현
FunctionResponse
- JSON 표현
FunctionResponsePart
- JSON 표현
FunctionResponseBlob
- JSON 표현
예약
FileData
- JSON 표현
ExecutableCode
- JSON 표현
언어
CodeExecutionResult
- JSON 표현
결과
VideoMetadata
- JSON 표현
도구
- JSON 표현
FunctionDeclaration
- JSON 표현
스키마
- JSON 표현
유형
동작
GoogleSearchRetrieval
- JSON 표현
DynamicRetrievalConfig
- JSON 표현
Mode(최빈값)
CodeExecution
GoogleSearch
- JSON 표현
간격
- JSON 표현
ComputerUse
- JSON 표현
환경
UrlContext
FileSearch
- JSON 표현
GoogleMaps
- JSON 표현
ToolConfig
- JSON 표현
FunctionCallingConfig
- JSON 표현
Mode(최빈값)
RetrievalConfig
- JSON 표현
LatLng
- JSON 표현
UsageMetadata
- JSON 표현
메서드

리소스: CachedContent

사전 처리되었으며 GenerativeService에 대한 후속 요청에서 사용할 수 있는 콘텐츠입니다.

캐시된 콘텐츠는 생성된 모델에서만 사용할 수 있습니다.

필드

contents[] object (Content)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 캐시할 콘텐츠입니다.

tools[] object (Tool)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 모델이 다음 대답을 생성하는 데 사용할 수 있는 Tools 목록

createTime string (Timestamp format)

출력 전용입니다. 캐시 항목의 생성 시간입니다.

updateTime string (Timestamp format)

출력 전용입니다. 캐시 항목이 마지막으로 업데이트된 시간(UTC)입니다.

usageMetadata object (UsageMetadata)

출력 전용입니다. 캐시된 콘텐츠 사용에 관한 메타데이터입니다.

expiration Union type

이 리소스가 만료되는 시점을 지정합니다. expiration는 다음 중 하나여야 합니다.

expireTime string (Timestamp format)

이 리소스가 만료된 것으로 간주되는 시간의 타임스탬프(UTC)입니다. 이 필드는 입력으로 전송된 항목에 관계없이 항상 출력으로 제공됩니다

ttl string (Duration format)

입력 전용입니다. 이 리소스의 새 TTL입니다(입력 전용).

소수점 아래가 최대 9자리까지이고 's'로 끝나는 초 단위 기간입니다. 예를 들면 "3.5s"입니다.

name string

출력 전용입니다. 식별자. 캐시된 콘텐츠를 참조하는 리소스 이름입니다. 형식: cachedContents/{id}

displayName string

선택사항입니다. 변경할 수 없습니다. 캐시된 콘텐츠의 사용자 생성 의미 있는 표시 이름입니다. 최대 128개의 유니코드 문자

model string

필수 항목입니다. 변경할 수 없습니다. 캐시된 콘텐츠에 사용할 Model의 이름입니다. 형식: models/{model}

systemInstruction object (Content)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 개발자가 설정한 시스템 요청 사항입니다. 현재는 텍스트만 지원됩니다.

toolConfig object (ToolConfig)

선택사항입니다. 입력 전용입니다. 변경할 수 없습니다. 도구 구성 이 구성은 모든 도구에서 공유됩니다.

JSON 표현

JSON 표현
{ "contents": [ { object (`Content`) } ], "tools": [ { object (`Tool`) } ], "createTime": string, "updateTime": string, "usageMetadata": { object (`UsageMetadata`) }, // expiration "expireTime": string, "ttl": string // Union type "name": string, "displayName": string, "model": string, "systemInstruction": { object (`Content`) }, "toolConfig": { object (`ToolConfig`) } }

{
  "contents": [
    {
      object (Content)
    }
  ],
  "tools": [
    {
      object (Tool)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "usageMetadata": {
    object (UsageMetadata)
  },

  // expiration
  "expireTime": string,
  "ttl": string
  // Union type
  "name": string,
  "displayName": string,
  "model": string,
  "systemInstruction": {
    object (Content)
  },
  "toolConfig": {
    object (ToolConfig)
  }
}

콘텐츠

메시지의 여러 부분으로 구성된 콘텐츠를 포함하는 구조화된 데이터의 기본 유형입니다.

Content에는 Content의 생산자를 지정하는 role 필드와 메시지 턴의 콘텐츠를 포함하는 멀티 파트 데이터가 포함된 parts 필드가 포함됩니다.

필드

parts[] object (Part)

단일 메시지를 구성하는 순서가 지정된 Parts입니다. 부분마다 MIME 유형이 다를 수 있습니다.

role string

선택사항입니다. 콘텐츠 제작자입니다. 'user' 또는 'model' 중 하나여야 합니다.

멀티턴 대화에 설정하는 것이 유용하며, 그렇지 않은 경우 비워 두거나 설정하지 않아도 됩니다.

JSON 표현
{ "parts": [ { object (`Part`) } ], "role": string }

부품

멀티 파트 Content 메시지의 일부인 미디어를 포함하는 데이터 유형입니다.

Part는 연결된 데이터 유형이 있는 데이터로 구성됩니다. Part에는 Part.data에서 허용되는 유형 중 하나만 포함될 수 있습니다.

inlineData 필드가 원시 바이트로 채워진 경우 Part에는 미디어의 유형과 하위 유형을 식별하는 고정 IANA MIME 유형이 있어야 합니다.

필드

thought boolean

선택사항입니다. 모델에서 파트를 추론했는지 여부를 나타냅니다.

thoughtSignature string (bytes format)

선택사항입니다. 후속 요청에서 재사용할 수 있도록 생각에 대한 불투명 서명입니다.

base64 인코딩 문자열입니다.

partMetadata object (Struct format)

파트와 연결된 맞춤 메타데이터입니다. genai.Part를 콘텐츠 표현으로 사용하는 에이전트는 추가 정보를 추적해야 할 수 있습니다. 예를 들어 파트가 시작되는 파일/소스의 이름이거나 여러 파트 스트림을 다중화하는 방법일 수 있습니다.

data Union type

data는 다음 중 하나여야 합니다.

text string

인라인 텍스트

inlineData object (Blob)

인라인 미디어 바이트입니다.

functionCall object (FunctionCall)

인수와 해당 값이 포함된 FunctionDeclaration.name을 나타내는 문자열이 포함된 모델에서 반환된 예측된 FunctionCall입니다.

functionResponse object (FunctionResponse)

FunctionDeclaration.name을 나타내는 문자열과 함수의 출력이 포함된 구조화된 JSON 객체가 포함된 FunctionCall의 결과 출력이 모델의 컨텍스트로 사용됩니다.

fileData object (FileData)

URI 기반 데이터.

executableCode object (ExecutableCode)

실행 목적으로 모델에서 생성된 코드입니다.

codeExecutionResult object (CodeExecutionResult)

ExecutableCode 실행 결과입니다.

metadata Union type

데이터의 추가 전처리를 제어합니다. metadata는 다음 중 하나여야 합니다.

videoMetadata object (VideoMetadata)

선택사항입니다. 동영상 메타데이터입니다. 메타데이터는 동영상 데이터가 inlineData 또는 fileData에 표시되는 동안에만 지정되어야 합니다.

JSON 표현

JSON 표현
{ "thought": boolean, "thoughtSignature": string, "partMetadata": { object }, // data "text": string, "inlineData": { object (`Blob`) }, "functionCall": { object (`FunctionCall`) }, "functionResponse": { object (`FunctionResponse`) }, "fileData": { object (`FileData`) }, "executableCode": { object (`ExecutableCode`) }, "codeExecutionResult": { object (`CodeExecutionResult`) } // Union type // metadata "videoMetadata": { object (`VideoMetadata`) } // Union type }

{
  "thought": boolean,
  "thoughtSignature": string,
  "partMetadata": {
    object
  },

  // data
  "text": string,
  "inlineData": {
    object (Blob)
  },
  "functionCall": {
    object (FunctionCall)
  },
  "functionResponse": {
    object (FunctionResponse)
  },
  "fileData": {
    object (FileData)
  },
  "executableCode": {
    object (ExecutableCode)
  },
  "codeExecutionResult": {
    object (CodeExecutionResult)
  }
  // Union type

  // metadata
  "videoMetadata": {
    object (VideoMetadata)
  }
  // Union type
}

blob

원시 미디어 바이트입니다.

텍스트는 원시 바이트로 전송하면 안 됩니다. 'text' 필드를 사용하세요.

필드

mimeType string

소스 데이터의 IANA 표준 MIME 유형입니다. 예: - image/png - image/jpeg 지원되지 않는 MIME 유형이 제공되면 오류가 반환됩니다. 지원되는 유형의 전체 목록은 지원되는 파일 형식을 참고하세요.

data string (bytes format)

미디어 형식의 원시 바이트입니다.

base64 인코딩 문자열입니다.

JSON 표현
{ "mimeType": string, "data": string }

FunctionCall

인수와 해당 값이 포함된 FunctionDeclaration.name을 나타내는 문자열이 포함된 모델에서 반환된 예측된 FunctionCall입니다.

필드

id string

선택사항입니다. 함수 호출의 고유 ID입니다. 값이 채워진 경우 클라이언트가 functionCall를 실행하고 일치하는 id를 가진 응답을 반환합니다.

name string

필수 항목입니다. 호출하려는 함수의 이름입니다. a~z, A~Z, 0~9이거나 밑줄과 대시를 포함해야 합니다(최대 64자 길이).

args object (Struct format)

선택사항입니다. JSON 객체 형식의 함수 파라미터와 값입니다.

JSON 표현
{ "id": string, "name": string, "args": { object } }

FunctionResponse

FunctionDeclaration.name을 나타내는 문자열과 함수의 출력이 포함된 구조화된 JSON 객체가 포함된 FunctionCall의 결과 출력이 모델의 컨텍스트로 사용됩니다. 여기에는 모델 예측에 기반하여 이루어진 FunctionCall의 결과가 포함되어야 합니다.

필드

id string

선택사항입니다. 이 응답이 속한 함수 호출의 ID입니다. 클라이언트가 해당 함수 호출 id와 일치하도록 채웁니다.

name string

필수 항목입니다. 호출하려는 함수의 이름입니다. a~z, A~Z, 0~9이거나 밑줄과 대시를 포함해야 합니다(최대 64자 길이).

response object (Struct format)

필수 항목입니다. JSON 객체 형식의 함수 응답입니다. 호출자는 함수의 구문에 맞는 원하는 키를 사용하여 함수 출력을 반환할 수 있습니다(예: 'output', 'result' 등). 특히 함수 호출이 실행되지 않은 경우 응답에 'error' 키가 있어 오류 세부정보를 모델에 반환할 수 있습니다.

parts[] object (FunctionResponsePart)

선택사항입니다. 함수 응답을 구성하는 순서가 지정된 Parts입니다. 부분마다 IANA MIME 유형이 다를 수 있습니다.

willContinue boolean

선택사항입니다. 함수 호출이 계속되고 더 많은 응답이 반환되어 함수 호출이 생성기로 전환됨을 나타냅니다. NON_BLOCKING 함수 호출에만 적용되며, 그 외의 경우에는 무시됩니다. false로 설정하면 향후 대답이 고려되지 않습니다. 함수 호출이 완료되었음을 알리기 위해 willContinue=False와 함께 빈 response를 반환할 수 있습니다. 이 경우에도 모델 생성이 트리거될 수 있습니다. 생성을 트리거하지 않고 함수 호출을 완료하려면 scheduling를 SILENT로 추가로 설정하세요.

scheduling enum (Scheduling)

선택사항입니다. 대화에서 대답이 예약되는 방식을 지정합니다. NON_BLOCKING 함수 호출에만 적용되며, 그 외의 경우에는 무시됩니다. 기본값은 WHEN_IDLE입니다.

JSON 표현
{ "id": string, "name": string, "response": { object }, "parts": [ { object (`FunctionResponsePart`) } ], "willContinue": boolean, "scheduling": enum (`Scheduling`) }

FunctionResponsePart

FunctionResponse 메시지의 일부인 미디어를 포함하는 데이터 유형입니다.

FunctionResponsePart는 연결된 데이터 유형이 있는 데이터로 구성됩니다. FunctionResponsePart에는 FunctionResponsePart.data에서 허용되는 유형 중 하나만 포함될 수 있습니다.

inlineData 필드가 원시 바이트로 채워진 경우 FunctionResponsePart에는 미디어의 유형과 하위 유형을 식별하는 고정 IANA MIME 유형이 있어야 합니다.

필드

data Union type

함수 응답 부분의 데이터입니다. data는 다음 중 하나여야 합니다.

inlineData object (FunctionResponseBlob)

인라인 미디어 바이트입니다.

JSON 표현
{ // data "inlineData": { object (`FunctionResponseBlob`) } // Union type }

FunctionResponseBlob

함수 응답의 원시 미디어 바이트입니다.

텍스트는 원시 바이트로 전송하면 안 됩니다. 'FunctionResponse.response' 필드를 사용하세요.

필드

mimeType string

data string (bytes format)

미디어 형식의 원시 바이트입니다.

base64 인코딩 문자열입니다.

JSON 표현
{ "mimeType": string, "data": string }

예약

대화에서 대답이 예약되는 방식을 지정합니다.

열거형
`SCHEDULING_UNSPECIFIED`	이 값은 사용되지 않습니다.
`SILENT`	결과를 대화 컨텍스트에만 추가하고 생성을 중단하거나 트리거하지 마세요.
`WHEN_IDLE`	결과를 대화 컨텍스트에 추가하고 진행 중인 생성을 중단하지 않고 출력을 생성하라는 메시지를 표시합니다.
`INTERRUPT`	결과를 대화 컨텍스트에 추가하고, 진행 중인 생성을 중단하고, 출력을 생성하라는 메시지를 표시합니다.

FileData

URI 기반 데이터.

필드

mimeType string

선택사항입니다. 소스 데이터의 IANA 표준 MIME 유형입니다.

fileUri string

필수 항목입니다. URI입니다.

JSON 표현


{
  "mimeType": string,
  "fileUri": string
}

JSON 표현
{ "mimeType": string, "fileUri": string }

ExecutableCode

실행 목적으로 모델에서 생성된 코드와 모델에 반환된 결과입니다.

CodeExecution 도구를 사용하는 경우에만 생성되며, 이 경우 코드가 자동으로 실행되고 해당하는 CodeExecutionResult도 생성됩니다.

필드

language enum (Language)

필수 항목입니다. code의 프로그래밍 언어입니다.

code string

필수 항목입니다. 실행할 코드입니다.

JSON 표현
{ "language": enum (`Language`), "code": string }

언어

생성된 코드에 지원되는 프로그래밍 언어입니다.

열거형
`LANGUAGE_UNSPECIFIED`	지정되지 않은 언어입니다. 이 값은 사용하면 안 됩니다.
`PYTHON`	numpy 및 simpy를 사용할 수 있는 Python >= 3.10 Python이 기본 언어입니다.

CodeExecutionResult

ExecutableCode 실행 결과입니다.

CodeExecution를 사용하는 경우에만 생성되며 항상 ExecutableCode를 포함하는 part가 뒤따릅니다.

필드

outcome enum (Outcome)

필수 항목입니다. 코드 실행의 결과입니다.

output string

선택사항입니다. 코드 실행이 성공하면 stdout이 포함되고, 그렇지 않으면 stderr 또는 기타 설명이 포함됩니다.

JSON 표현
{ "outcome": enum (`Outcome`), "output": string }

결과

코드 실행의 가능한 결과의 열거형입니다.

열거형
`OUTCOME_UNSPECIFIED`	지정되지 않은 상태입니다. 이 값은 사용하면 안 됩니다.
`OUTCOME_OK`	코드 실행이 완료되었습니다.
`OUTCOME_FAILED`	코드 실행이 완료되었지만 실패했습니다. `stderr`에는 이유가 포함됩니다.
`OUTCOME_DEADLINE_EXCEEDED`	코드 실행 시간이 너무 오래돼서 취소되었습니다. 출력이 부분적으로 표시되거나 표시되지 않을 수 있습니다.

VideoMetadata

메타데이터는 입력 동영상 콘텐츠를 설명합니다.

필드

startOffset string (Duration format)

선택사항입니다. 동영상의 시작 오프셋입니다.

소수점 아래가 최대 9자리까지이고 's'로 끝나는 초 단위 기간입니다. 예를 들면 "3.5s"입니다.

endOffset string (Duration format)

선택사항입니다. 동영상의 종료 오프셋입니다.

소수점 아래가 최대 9자리까지이고 's'로 끝나는 초 단위 기간입니다. 예를 들면 "3.5s"입니다.

fps number

선택사항입니다. 모델로 전송된 동영상의 프레임 속도입니다. 지정하지 않으면 기본값은 1.0입니다. fps 범위는 (0.0, 24.0]입니다.

JSON 표현
{ "startOffset": string, "endOffset": string, "fps": number }

도구

모델이 대답을 생성하는 데 사용할 수 있는 도구 세부정보입니다.

Tool은 시스템이 모델의 지식과 범위를 벗어나 외부 시스템과 상호작용하여 작업 또는 작업 집합을 수행할 수 있도록 하는 코드 조각입니다.

다음 ID: 13

필드

functionDeclarations[] object (FunctionDeclaration)

선택사항입니다. 함수 호출에 사용할 수 있는 모델에 제공되는 FunctionDeclarations 목록입니다.

모델 또는 시스템이 함수를 실행하지 않습니다. 대신 정의된 함수가 실행을 위해 클라이언트 측에 인수가 있는 FunctionCall로 반환될 수 있습니다. 모델은 응답에서 FunctionCall를 채워 이러한 함수의 하위 집합을 호출할 수 있습니다. 다음 대화 턴에는 다음 모델 턴을 위한 Content.role 'function' 생성 컨텍스트가 포함된 FunctionResponse가 포함될 수 있습니다.

googleSearchRetrieval object (GoogleSearchRetrieval)

선택사항입니다. Google 검색으로 작동하는 검색 도구입니다.

codeExecution object (CodeExecution)

선택사항입니다. 모델이 생성의 일부로 코드를 실행할 수 있도록 지원합니다.

googleSearch object (GoogleSearch)

선택사항입니다. GoogleSearch 도구 유형입니다. 모델에서 Google 검색을 지원하는 도구 Google에서 제공합니다.

computerUse object (ComputerUse)

선택사항입니다. 모델이 컴퓨터와 직접 상호작용하도록 지원하는 도구 사용 설정하면 컴퓨터 사용 관련 함수 선언이 자동으로 채워집니다.

urlContext object (UrlContext)

선택사항입니다. URL 컨텍스트 가져오기를 지원하는 도구입니다.

fileSearch object (FileSearch)

선택사항입니다. FileSearch 도구 유형입니다. 시맨틱 검색 코퍼스에서 지식을 검색하는 도구

googleMaps object (GoogleMaps)

선택사항입니다. 사용자 질문과 관련된 지리정보 컨텍스트를 사용하여 모델의 대답을 그라운딩할 수 있는 도구

JSON 표현

JSON 표현
{ "functionDeclarations": [ { object (`FunctionDeclaration`) } ], "googleSearchRetrieval": { object (`GoogleSearchRetrieval`) }, "codeExecution": { object (`CodeExecution`) }, "googleSearch": { object (`GoogleSearch`) }, "computerUse": { object (`ComputerUse`) }, "urlContext": { object (`UrlContext`) }, "fileSearch": { object (`FileSearch`) }, "googleMaps": { object (`GoogleMaps`) } }

{
  "functionDeclarations": [
    {
      object (FunctionDeclaration)
    }
  ],
  "googleSearchRetrieval": {
    object (GoogleSearchRetrieval)
  },
  "codeExecution": {
    object (CodeExecution)
  },
  "googleSearch": {
    object (GoogleSearch)
  },
  "computerUse": {
    object (ComputerUse)
  },
  "urlContext": {
    object (UrlContext)
  },
  "fileSearch": {
    object (FileSearch)
  },
  "googleMaps": {
    object (GoogleMaps)
  }
}

FunctionDeclaration

OpenAPI 3.03 사양에 따라 정의된 함수 선언의 구조화된 표현입니다. 이 선언에는 함수 이름과 매개변수가 포함됩니다. 이 FunctionDeclaration은 모델에서 Tool로 사용하고 클라이언트에서 실행할 수 있는 코드 블록을 나타냅니다.

필드

name string

필수 항목입니다. 함수 이름입니다. a~z, A~Z, 0~9이거나 밑줄, 콜론, 점, 대시를 포함할 수 있고 최대 64자 길이입니다.

description string

필수 항목입니다. 함수에 대한 간단한 설명입니다.

behavior enum (Behavior)

선택사항입니다. 함수 동작을 지정합니다. 현재 BidiGenerateContent 메서드에서만 지원됩니다.

parameters object (Schema)

선택사항입니다. 이 함수의 매개변수를 설명합니다. Open API 3.03 매개변수 객체 문자열 키를 반영합니다. 매개변수의 이름입니다. 매개변수 이름은 대소문자를 구분합니다. 스키마 값: 파라미터에 사용되는 유형을 정의하는 스키마입니다.

parametersJsonSchema value (Value format)

선택사항입니다. 함수의 매개변수를 JSON 스키마 형식으로 설명합니다. 스키마는 속성이 함수의 매개변수인 객체를 설명해야 합니다. 예를 들면 다음과 같습니다.

{
  "type": "object",
  "properties": {
    "name": { "type": "string" },
    "age": { "type": "integer" }
  },
  "additionalProperties": false,
  "required": ["name", "age"],
  "propertyOrdering": ["name", "age"]
}

이 필드는 parameters과 상호 배타적입니다.

response object (Schema)

선택사항입니다. 이 함수의 출력을 JSON 스키마 형식으로 설명합니다. Open API 3.03 응답 객체를 반영합니다. 스키마는 함수의 응답 값에 사용되는 유형을 정의합니다.

responseJsonSchema value (Value format)

선택사항입니다. 이 함수의 출력을 JSON 스키마 형식으로 설명합니다. 스키마에 지정된 값이 함수의 응답 값입니다.

이 필드는 response과 상호 배타적입니다.

JSON 표현

JSON 표현
{ "name": string, "description": string, "behavior": enum (`Behavior`), "parameters": { object (`Schema`) }, "parametersJsonSchema": value, "response": { object (`Schema`) }, "responseJsonSchema": value }

{
  "name": string,
  "description": string,
  "behavior": enum (Behavior),
  "parameters": {
    object (Schema)
  },
  "parametersJsonSchema": value,
  "response": {
    object (Schema)
  },
  "responseJsonSchema": value
}

스키마

Schema 객체를 사용하면 입력 및 출력 데이터 유형을 정의할 수 있습니다. 이러한 유형은 객체일 수도 있지만 기본 유형과 배열일 수도 있습니다. OpenAPI 3.0 스키마 객체의 선택된 하위 집합을 나타냅니다.

필드

type enum (Type)

필수 항목입니다. 데이터 유형입니다.

format string

선택사항입니다. 데이터 형식입니다. 모든 값이 허용되지만 대부분은 특별한 기능을 트리거하지 않습니다.

title string

선택사항입니다. 스키마의 제목입니다.

description string

선택사항입니다. 매개변수에 대한 간단한 설명입니다. 여기에는 사용 예가 포함될 수 있습니다. 매개변수 설명은 마크다운 형식일 수 있습니다.

nullable boolean

선택사항입니다. null 값을 나타냅니다.

enum[] string

선택사항입니다. enum 형식의 Type.STRING 요소의 가능한 값입니다. 예를 들어 열거형 방향을 {type:STRING, format:enum, enum:["EAST", NORTH", "SOUTH", "WEST"]}로 정의할 수 있습니다.

maxItems string (int64 format)

선택사항입니다. Type.ARRAY의 최대 요소 수입니다.

minItems string (int64 format)

선택사항입니다. Type.ARRAY의 최소 요소 수입니다.

properties map (key: string, value: object (Schema))

선택사항입니다. Type.OBJECT의 속성입니다.

"key": value 쌍 목록을 포함하는 객체입니다. 예: { "name": "wrench", "mass": "1.3kg", "count": "3" }

required[] string

선택사항입니다. Type.OBJECT의 필수 속성입니다.

minProperties string (int64 format)

선택사항입니다. Type.OBJECT의 최소 속성 수입니다.

maxProperties string (int64 format)

선택사항입니다. Type.OBJECT의 최대 속성 수입니다.

minLength string (int64 format)

선택사항입니다. TYPE.STRING의 최소 길이인 스키마 필드

maxLength string (int64 format)

선택사항입니다. Type.STRING의 최대 길이

pattern string

선택사항입니다. 문자열을 정규 표현식으로 제한하는 Type.STRING의 패턴입니다.

example value (Value format)

선택사항입니다. 객체의 예입니다. 객체가 루트인 경우에만 채워집니다.

anyOf[] object (Schema)

선택사항입니다. 값은 목록에 있는 하위 스키마 중 하나 이상에 대해 검증되어야 합니다.

propertyOrdering[] string

선택사항입니다. 속성의 순서입니다. Open API 사양의 표준 필드가 아닙니다. 응답의 속성 순서를 결정하는 데 사용됩니다.

default value (Value format)

선택사항입니다. 필드의 기본값입니다. JSON 스키마에 따라 이 필드는 문서 생성기를 위한 것이며 검증에는 영향을 미치지 않습니다. 따라서 default 필드가 있는 스키마를 전송하는 개발자에게 알 수 없는 필드 오류가 표시되지 않도록 여기에 포함되고 무시됩니다.

items object (Schema)

선택사항입니다. Type.ARRAY 요소의 스키마입니다.

minimum number

선택사항입니다. INTEGER 및 NUMBER 유형의 스키마 필드 Type.INTEGER 및 Type.NUMBER의 최솟값

maximum number

선택사항입니다. Type.INTEGER 및 Type.NUMBER의 최댓값

JSON 표현

JSON 표현
{ "type": enum (`Type`), "format": string, "title": string, "description": string, "nullable": boolean, "enum": [ string ], "maxItems": string, "minItems": string, "properties": { string: { object (`Schema`) }, ... }, "required": [ string ], "minProperties": string, "maxProperties": string, "minLength": string, "maxLength": string, "pattern": string, "example": value, "anyOf": [ { object (`Schema`) } ], "propertyOrdering": [ string ], "default": value, "items": { object (`Schema`) }, "minimum": number, "maximum": number }

{
  "type": enum (Type),
  "format": string,
  "title": string,
  "description": string,
  "nullable": boolean,
  "enum": [
    string
  ],
  "maxItems": string,
  "minItems": string,
  "properties": {
    string: {
      object (Schema)
    },
    ...
  },
  "required": [
    string
  ],
  "minProperties": string,
  "maxProperties": string,
  "minLength": string,
  "maxLength": string,
  "pattern": string,
  "example": value,
  "anyOf": [
    {
      object (Schema)
    }
  ],
  "propertyOrdering": [
    string
  ],
  "default": value,
  "items": {
    object (Schema)
  },
  "minimum": number,
  "maximum": number
}

유형

Type에는 https://spec.openapis.org/oas/v3.0.3#data-types에 정의된 OpenAPI 데이터 유형 목록이 포함됩니다.

열거형
`TYPE_UNSPECIFIED`	지정되지 않았으므로 사용해서는 안 됩니다.
`STRING`	문자열 유형입니다.
`NUMBER`	번호 유형입니다.
`INTEGER`	정수 유형입니다.
`BOOLEAN`	불리언 유형입니다.
`ARRAY`	배열 유형입니다.
`OBJECT`	객체 유형입니다.
`NULL`	Null 유형입니다.

동작

함수 동작을 정의합니다. 기본값은 BLOCKING입니다.

열거형
`UNSPECIFIED`	이 값은 사용되지 않습니다.
`BLOCKING`	설정된 경우 시스템은 대화를 계속하기 전에 함수 응답을 기다립니다.
`NON_BLOCKING`	설정된 경우 시스템은 함수 응답을 기다리지 않습니다. 대신 사용자와 모델 간의 대화를 유지하면서 함수 응답이 제공되는 대로 처리하려고 시도합니다.

GoogleSearchRetrieval

그라운딩을 위해 공개 웹 데이터를 검색하는 도구로, Google에서 제공합니다.

필드

dynamicRetrievalConfig object (DynamicRetrievalConfig)

지정된 소스의 동적 검색 구성을 지정합니다.

JSON 표현
{ "dynamicRetrievalConfig": { object (`DynamicRetrievalConfig`) } }

DynamicRetrievalConfig

동적 가져오기를 맞춤설정하는 옵션을 설명합니다.

필드

mode enum (Mode)

동적 검색에 사용할 예측 변수의 모드입니다.

dynamicThreshold number

동적 검색에 사용할 임계값입니다. 설정하지 않으면 시스템 기본값이 사용됩니다.

JSON 표현
{ "mode": enum (`Mode`), "dynamicThreshold": number }

모드

동적 검색에 사용할 예측 변수의 모드입니다.

열거형
`MODE_UNSPECIFIED`	항상 가져오기를 트리거합니다.
`MODE_DYNAMIC`	시스템에서 필요하다고 판단하는 경우에만 가져오기를 실행합니다.

CodeExecution

이 유형에는 필드가 없습니다.

모델에서 생성된 코드를 실행하고 결과를 모델에 자동으로 반환하는 도구입니다.

이 도구를 사용할 때만 생성되는 ExecutableCode 및 CodeExecutionResult도 참고하세요.

GoogleSearch

GoogleSearch 도구 유형입니다. 모델에서 Google 검색을 지원하는 도구 Google에서 제공합니다.

필드

timeRangeFilter object (Interval)

선택사항입니다. 검색 결과를 특정 기간으로 필터링합니다. 고객이 시작 시간을 설정하는 경우 종료 시간도 설정해야 합니다 (그 반대의 경우도 마찬가지).

JSON 표현
{ "timeRangeFilter": { object (`Interval`) } }

간격

타임스탬프 시작(포함) 및 타임스탬프 종료(제외)로 인코딩된 시간 간격을 나타냅니다.

시작은 종료보다 작거나 같아야 합니다. 시작이 종료와 같으면 간격이 비어 있습니다(시간과 일치하지 않음). 시작과 종료가 모두 지정되지 않은 경우 간격은 모든 시간과 일치합니다.

필드

startTime string (Timestamp format)

선택사항입니다. 간격의 시작(포함)입니다.

지정된 경우 이 간격과 일치하는 타임스탬프는 시작과 같거나 시작 이후여야 합니다.

endTime string (Timestamp format)

선택사항입니다. 간격의 끝(제외)입니다.

지정된 경우 이 간격과 일치하는 타임스탬프는 종료 시간 이전이어야 합니다.

JSON 표현
{ "startTime": string, "endTime": string }

ComputerUse

컴퓨터 사용 도구 유형입니다.

필드

environment enum (Environment)

필수 항목입니다. 운영되는 환경입니다.

excludedPredefinedFunctions[] string

선택사항입니다. 기본적으로 사전 정의된 함수는 최종 모델 호출에 포함됩니다. 일부는 자동으로 포함되지 않도록 명시적으로 제외할 수 있습니다. 이는 두 가지 목적으로 사용될 수 있습니다. 1. 더 제한적이거나 다른 작업 공간을 사용합니다. 2. 사전 정의된 함수의 정의 / 안내 개선

JSON 표현
{ "environment": enum (`Environment`), "excludedPredefinedFunctions": [ string ] }

환경

작동 중인 환경(예: 웹브라우저)을 나타냅니다.

열거형
`ENVIRONMENT_UNSPECIFIED`	기본값은 브라우저입니다.
`ENVIRONMENT_BROWSER`	웹브라우저에서 작동합니다.

UrlContext

이 유형에는 필드가 없습니다.

URL 컨텍스트 가져오기를 지원하는 도구입니다.

FileSearch

시맨틱 검색 코퍼스에서 지식을 가져오는 FileSearch 도구입니다. 파일은 ImportFile API를 사용하여 시맨틱 검색 코퍼스로 가져옵니다.

필드

fileSearchStoreNames[] string

필수 항목입니다. 검색할 fileSearchStore의 이름입니다. 예: fileSearchStores/my-file-search-store-123

metadataFilter string

선택사항입니다. 시맨틱 검색 문서 및 청크에 적용할 메타데이터 필터입니다.

topK integer

선택사항입니다. 가져올 시맨틱 검색 청크의 수입니다.

JSON 표현
{ "fileSearchStoreNames": [ string ], "metadataFilter": string, "topK": integer }

GoogleMaps

사용자 질문에 대한 지리 공간 컨텍스트를 제공하는 GoogleMaps 도구입니다.

필드

enableWidget boolean

선택사항입니다. 응답의 GroundingMetadata에 위젯 컨텍스트 토큰을 반환할지 여부입니다. 개발자는 위젯 컨텍스트 토큰을 사용하여 모델이 대답에서 참조하는 장소와 관련된 지리정보 컨텍스트로 Google 지도 위젯을 렌더링할 수 있습니다.

JSON 표현
{ "enableWidget": boolean }

ToolConfig

요청에서 Tool 사용을 지정하는 매개변수가 포함된 도구 구성입니다.

필드

functionCallingConfig object (FunctionCallingConfig)

선택사항입니다. 함수 호출 구성입니다.

retrievalConfig object (RetrievalConfig)

선택사항입니다. 검색 구성입니다.

JSON 표현
{ "functionCallingConfig": { object (`FunctionCallingConfig`) }, "retrievalConfig": { object (`RetrievalConfig`) } }

FunctionCallingConfig

함수 호출 동작을 지정하기 위한 구성입니다.

필드

mode enum (Mode)

선택사항입니다. 함수 호출이 실행되어야 하는 모드를 지정합니다. 지정하지 않으면 기본값이 AUTO로 설정됩니다.

allowedFunctionNames[] string

선택사항입니다. 제공되는 경우 모델이 호출할 함수를 제한하는 함수 이름 세트입니다.

모드가 ANY 또는 VALIDATED인 경우에만 설정해야 합니다. 함수 이름은 [FunctionDeclaration.name]과 일치해야 합니다. 설정되면 모델이 허용된 함수 이름에서만 함수 호출을 예측합니다.

JSON 표현
{ "mode": enum (`Mode`), "allowedFunctionNames": [ string ] }

모드

실행 모드를 정의하여 함수 호출의 실행 동작을 정의합니다.

열거형
`MODE_UNSPECIFIED`	지정되지 않은 함수 호출 모드입니다. 이 값은 사용하면 안 됩니다.
`AUTO`	기본 모델 동작으로, 모델이 함수 호출 또는 자연어 응답을 예측하도록 결정합니다.
`ANY`	모델이 항상 함수 호출만 예측하도록 제한됩니다. 'allowedFunctionNames'가 설정되면 예측 함수 호출이 'allowedFunctionNames' 중 하나로 제한되고, 그렇지 않으면 예측 함수 호출이 제공된 'functionDeclarations' 중 하나가 됩니다.
`NONE`	모델이 함수 호출을 예측하지 않습니다. 모델 동작은 함수 선언을 전달하지 않는 경우와 동일합니다.
`VALIDATED`	모델이 함수 호출 또는 자연어 응답을 예측하도록 결정하지만 제한된 디코딩으로 함수 호출을 검증합니다. 'allowedFunctionNames'가 설정되면 예측 함수 호출이 'allowedFunctionNames' 중 하나로 제한되고, 그렇지 않으면 예측 함수 호출이 제공된 'functionDeclarations' 중 하나가 됩니다.

RetrievalConfig

검색 구성입니다.

필드

latLng object (LatLng)

선택사항입니다. 사용자의 위치입니다.

languageCode string

선택사항입니다. 사용자의 언어 코드입니다. 콘텐츠의 언어 코드입니다. BCP47에 정의된 언어 태그를 사용합니다.

JSON 표현
{ "latLng": { object (`LatLng`) }, "languageCode": string }

LatLng

위도/경도 쌍을 나타내는 객체로 위도와 경도를 나타내는 복식 쌍으로 표현됩니다. 달리 명시되지 않는 한 이 객체는 WGS84 표준을 준수해야 합니다. 값은 정규화된 범위 내에 있어야 합니다.

필드

latitude number

위도(도)입니다. 범위는 [-90.0, +90.0]입니다.

longitude number

경도입니다. 범위는 [-180.0, +180.0]입니다.

JSON 표현
{ "latitude": number, "longitude": number }

UsageMetadata

캐시된 콘텐츠 사용에 관한 메타데이터입니다.

필드

totalTokenCount integer

캐시된 콘텐츠가 사용하는 총 토큰 수입니다.

JSON 표현
{ "totalTokenCount": integer }