Gemini 2.5 Pro Experimental, unser fortschrittlichstes Modell, ist jetzt verfügbar. Weitere Informationen

Diese Seite wurde von der Cloud Translation API übersetzt.

Caching

Mit dem Kontext-Caching können Sie vorab berechnete Eingabetokens speichern und wiederverwenden, die Sie wiederholt verwenden möchten, z. B. wenn Sie verschiedene Fragen zu derselben Mediendatei stellen. Je nach Nutzung kann dies zu Kosten- und Geschwindigkeitseinsparungen führen. Eine ausführliche Einführung finden Sie im Leitfaden zum Kontext-Caching.

Erstellt die Ressource „CachedContent“.

Endpunkt

Beitrag https://generativelanguage.googleapis.com/v1beta/cachedContents

Anfragetext

Der Anfragetext enthält eine Instanz von CachedContent.

Felder

contents[] object (Content)

Optional. Nur Eingabe. Nicht veränderbar. Die Inhalte, die im Cache gespeichert werden sollen.

tools[] object (Tool)

Optional. Nur Eingabe. Nicht veränderbar. Eine Liste von Tools, die das Modell zum Generieren der nächsten Antwort verwenden kann

expiration Union type

Gibt an, wann diese Ressource abläuft. Für expiration ist nur einer der folgenden Werte zulässig:

expireTime string (Timestamp format)

Der Zeitstempel in UTC, der angibt, wann diese Ressource als abgelaufen gilt. Dieser Wert wird immer bei der Ausgabe angegeben, unabhängig davon, was bei der Eingabe gesendet wurde.

Es wird RFC 3339 verwendet, wobei die generierte Ausgabe immer Z-normalisiert ist und 0, 3, 6 oder 9 Glieder mit Dezimalstellen enthält. Andere Achsenbezeichnungen als „Z“ sind ebenfalls zulässig. Beispiele: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" oder "2014-10-02T15:01:23+05:30".

ttl string (Duration format)

Nur Eingabe. Neue TTL für diese Ressource, nur Eingabe.

Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit "s". Beispiel: "3.5s".

name string

Optional. Kennung. Der Ressourcenname, der sich auf die im Cache gespeicherten Inhalte bezieht. Format: cachedContents/{id}

displayName string

Optional. Nicht veränderbar. Der vom Nutzer erstellte aussagekräftige Anzeigename der im Cache gespeicherten Inhalte. Maximal 128 Unicode-Zeichen.

model string

Erforderlich. Nicht veränderbar. Der Name der Model, die für zwischengespeicherte Inhalte verwendet werden soll. Format: models/{model}

systemInstruction object (Content)

Optional. Nur Eingabe. Nicht veränderbar. Systemanweisung des Entwicklers. Derzeit nur Text.

toolConfig object (ToolConfig)

Optional. Nur Eingabe. Nicht veränderbar. Toolkonfiguration Diese Konfiguration wird für alle Tools verwendet.

Beispielanfrage

Einfach

Python

from google import genai
from google.genai import types

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config=types.CreateCachedContentConfig(
        contents=[document],
        system_instruction="You are an expert analyzing transcripts.",
    ),
)
print(cache)

response = client.models.generate_content(
    model=model_name,
    contents="Please summarize this transcript",
    config=types.GenerateContentConfig(cached_content=cache.name),
)
print(response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
console.log("Cache created:", cache);

const response = await ai.models.generateContent({
  model: modelName,
  contents: "Please summarize this transcript",
  config: { cachedContent: cache.name },
});
console.log("Response text:", response.text);cache.js

Ok

file, err := client.UploadFileFromPath(ctx,
	filepath.Join(testDataDir, "a11.txt"),
	&genai.UploadFileOptions{MIMEType: "text/plain"})
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)
fd := genai.FileData{URI: file.URI}

argcc := &genai.CachedContent{
	Model:             "gemini-1.5-flash-001",
	SystemInstruction: genai.NewUserContent(genai.Text("You are an expert analyzing transcripts.")),
	Contents:          []*genai.Content{genai.NewUserContent(fd)},
}
cc, err := client.CreateCachedContent(ctx, argcc)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteCachedContent(ctx, cc.Name)

modelWithCache := client.GenerativeModelFromCachedContent(cc)
prompt := "Please summarize this transcript"
resp, err := modelWithCache.GenerateContent(ctx, genai.Text(prompt))
if err != nil {
	log.Fatal(err)
}

printResponse(resp)docs-snippets_test.go

Muschel

wget https://storage.googleapis.com/generativeai-downloads/data/a11.txt
echo '{
  "model": "models/gemini-1.5-flash-001",
  "contents":[
    {
      "parts":[
        {
          "inline_data": {
            "mime_type":"text/plain",
            "data": "'$(base64 $B64FLAGS a11.txt)'"
          }
        }
      ],
    "role": "user"
    }
  ],
  "systemInstruction": {
    "parts": [
      {
        "text": "You are an expert at analyzing transcripts."
      }
    ]
  },
  "ttl": "300s"
}' > request.json

curl -X POST "https://generativelanguage.googleapis.com/v1beta/cachedContents?key=$GEMINI_API_KEY" \
 -H 'Content-Type: application/json' \
 -d @request.json \
 > cache.json

CACHE_NAME=$(cat cache.json | grep '"name":' | cut -d '"' -f 4 | head -n 1)

curl -X POST "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-001:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
      "contents": [
        {
          "parts":[{
            "text": "Please summarize this transcript"
          }],
          "role": "user"
        },
      ],
      "cachedContent": "'$CACHE_NAME'"
    }'cache.sh

Von (Name)

Python

from google import genai
from google.genai import types

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config=types.CreateCachedContentConfig(
        contents=[document],
        system_instruction="You are an expert analyzing transcripts.",
    ),
)
cache_name = cache.name  # Save the name for later

# Later retrieve the cache
cache = client.caches.get(name=cache_name)
response = client.models.generate_content(
    model=model_name,
    contents="Find a lighthearted moment from this transcript",
    config=types.GenerateContentConfig(cached_content=cache.name),
)
print(response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
const cacheName = cache.name; // Save the name for later

// Later retrieve the cache
const retrievedCache = await ai.caches.get({ name: cacheName });
const response = await ai.models.generateContent({
  model: modelName,
  contents: "Find a lighthearted moment from this transcript",
  config: { cachedContent: retrievedCache.name },
});
console.log("Response text:", response.text);cache.js

Ok

file, err := client.UploadFileFromPath(ctx, filepath.Join(testDataDir, "a11.txt"), nil)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)
fd := genai.FileData{URI: file.URI}

argcc := &genai.CachedContent{
	Model:             "gemini-1.5-flash-001",
	SystemInstruction: genai.NewUserContent(genai.Text("You are an expert analyzing transcripts.")),
	Contents:          []*genai.Content{genai.NewUserContent(fd)},
}
cc, err := client.CreateCachedContent(ctx, argcc)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteCachedContent(ctx, cc.Name)

// Save the name for later
cacheName := cc.Name

// ... Later
cc2, err := client.GetCachedContent(ctx, cacheName)
if err != nil {
	log.Fatal(err)
}
modelWithCache := client.GenerativeModelFromCachedContent(cc2)
prompt := "Find a lighthearted moment from this transcript"
resp, err := modelWithCache.GenerateContent(ctx, genai.Text(prompt))
if err != nil {
	log.Fatal(err)
}

printResponse(resp)docs-snippets_test.go

Über Google Chat

Python

from google import genai
from google.genai import types

client = genai.Client()
model_name = "gemini-1.5-flash-001"
system_instruction = "You are an expert analyzing transcripts."

# Create a chat session with the given system instruction.
chat = client.chats.create(
    model=model_name,
    config=types.GenerateContentConfig(system_instruction=system_instruction),
)
document = client.files.upload(file=media / "a11.txt")

response = chat.send_message(
    message=["Hi, could you summarize this transcript?", document]
)
print("\n\nmodel:  ", response.text)
response = chat.send_message(
    message=["Okay, could you tell me more about the trans-lunar injection"]
)
print("\n\nmodel:  ", response.text)

# To cache the conversation so far, pass the chat history as the list of contents.
cache = client.caches.create(
    model=model_name,
    config={
        "contents": chat.get_history(),
        "system_instruction": system_instruction,
    },
)
# Continue the conversation using the cached content.
chat = client.chats.create(
    model=model_name,
    config=types.GenerateContentConfig(cached_content=cache.name),
)
response = chat.send_message(
    message="I didn't understand that last part, could you explain it in simpler language?"
)
print("\n\nmodel:  ", response.text)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const modelName = "gemini-1.5-flash-001";
const systemInstruction = "You are an expert analyzing transcripts.";

// Create a chat session with the system instruction.
const chat = ai.chats.create({
  model: modelName,
  config: { systemInstruction: systemInstruction },
});
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);

let response = await chat.sendMessage({
  message: createUserContent([
    "Hi, could you summarize this transcript?",
    createPartFromUri(document.uri, document.mimeType),
  ]),
});
console.log("\n\nmodel:", response.text);

response = await chat.sendMessage({
  message: "Okay, could you tell me more about the trans-lunar injection",
});
console.log("\n\nmodel:", response.text);

// To cache the conversation so far, pass the chat history as the list of contents.
const chatHistory = chat.getHistory();
const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: chatHistory,
    systemInstruction: systemInstruction,
  },
});

// Continue the conversation using the cached content.
const chatWithCache = ai.chats.create({
  model: modelName,
  config: { cachedContent: cache.name },
});
response = await chatWithCache.sendMessage({
  message:
    "I didn't understand that last part, could you explain it in simpler language?",
});
console.log("\n\nmodel:", response.text);cache.js

Ok

file, err := client.UploadFileFromPath(ctx, filepath.Join(testDataDir, "a11.txt"), nil)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)
fd := genai.FileData{URI: file.URI}

modelName := "gemini-1.5-flash-001"
model := client.GenerativeModel(modelName)
model.SystemInstruction = genai.NewUserContent(genai.Text("You are an expert analyzing transcripts."))

cs := model.StartChat()
resp, err := cs.SendMessage(ctx, genai.Text("Hi, could you summarize this transcript?"), fd)
if err != nil {
	log.Fatal(err)
}

resp, err = cs.SendMessage(ctx, genai.Text("Okay, could you tell me more about the trans-lunar injection"))
if err != nil {
	log.Fatal(err)
}

// To cache the conversation so far, pass the chat history as the list of
// contents.

argcc := &genai.CachedContent{
	Model:             modelName,
	SystemInstruction: model.SystemInstruction,
	Contents:          cs.History,
}
cc, err := client.CreateCachedContent(ctx, argcc)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteCachedContent(ctx, cc.Name)

modelWithCache := client.GenerativeModelFromCachedContent(cc)
cs = modelWithCache.StartChat()
resp, err = cs.SendMessage(ctx, genai.Text("I didn't understand that last part, could you please explain it in simpler language?"))
if err != nil {
	log.Fatal(err)
}
printResponse(resp)
docs-snippets_test.go

Antworttext

Bei Erfolg enthält der Antworttext eine neu erstellte Instanz von CachedContent.

Methode: cachedContents.list

Endpunkt
Anfrageparameter
Anfragetext
Antworttext
- JSON-Darstellung

Listet CachedContents auf.

Endpunkt

get https://generativelanguage.googleapis.com/v1beta/cachedContents

Abfrageparameter

pageSize integer

Optional. Die maximale Anzahl der im Cache gespeicherten Inhalte, die zurückgegeben werden sollen. Der Dienst gibt möglicherweise weniger als diesen Wert zurück. Wenn nicht angegeben, wird eine Standardanzahl von Elementen (unter der maximalen Anzahl) zurückgegeben. Der Höchstwert beträgt 1.000. Werte über 1.000 werden implizit auf 1.000 umgewandelt.

pageToken string

Optional. Ein Seitentoken, das von einem vorherigen cachedContents.list-Aufruf empfangen wurde. Geben Sie diese an, um die nachfolgende Seite abzurufen.

Beim Paginieren müssen alle anderen für cachedContents.list bereitgestellten Parameter mit dem Aufruf übereinstimmen, der das Seitentoken bereitgestellt hat.

Anfragetext

Der Anfragetext muss leer sein.

Antworttext

Antwort mit der Liste „CachedContents“

Bei Erfolg enthält der Antworttext Daten mit der folgenden Struktur:

Felder

cachedContents[] object (CachedContent)

Liste der im Cache gespeicherten Inhalte.

nextPageToken string

Ein Token, das als pageToken gesendet werden kann, um die nächste Seite abzurufen. Wenn dieses Feld weggelassen wird, gibt es keine nachfolgenden Seiten.

JSON-Darstellung
{ "cachedContents": [ { object (`CachedContent`) } ], "nextPageToken": string }

Methode: cachedContents.get

Endpunkt
Pfadparameter
Anfragetext
Antworttext
Beispielanfrage
- Basic

Liest die CachedContent-Ressource.

Endpunkt

get https://generativelanguage.googleapis.com/v1beta/{name=cachedContents/*}

Pfadparameter

name string

Erforderlich. Der Ressourcenname, der sich auf den Inhaltscache-Eintrag bezieht. Format: cachedContents/{id}. Sie hat das Format cachedContents/{cachedcontent}.

Anfragetext

Der Anfragetext muss leer sein.

Beispielanfrage

Python

from google import genai

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)
print(client.caches.get(name=cache.name))cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
const retrievedCache = await ai.caches.get({ name: cache.name });
console.log("Retrieved Cache:", retrievedCache);cache.js

Ok

file, err := client.UploadFileFromPath(ctx, filepath.Join(testDataDir, "a11.txt"), nil)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)
fd := genai.FileData{URI: file.URI}

argcc := &genai.CachedContent{
	Model:             "gemini-1.5-flash-001",
	SystemInstruction: genai.NewUserContent(genai.Text("You are an expert analyzing transcripts.")),
	Contents:          []*genai.Content{genai.NewUserContent(fd)},
}
cc, err := client.CreateCachedContent(ctx, argcc)
if err != nil {
	log.Fatal(err)
}
defer client.DeleteCachedContent(ctx, cc.Name)

// Save the name for later
cacheName := cc.Name

// ... Later
cc2, err := client.GetCachedContent(ctx, cacheName)
if err != nil {
	log.Fatal(err)
}
modelWithCache := client.GenerativeModelFromCachedContent(cc2)
prompt := "Find a lighthearted moment from this transcript"
resp, err := modelWithCache.GenerateContent(ctx, genai.Text(prompt))
if err != nil {
	log.Fatal(err)
}

printResponse(resp)docs-snippets_test.go

Muschel

curl "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY"cache.sh

Antworttext

Wenn der Vorgang erfolgreich abgeschlossen wurde, enthält der Antworttext eine Instanz von CachedContent.

Methode: cachedContents.patch

Endpunkt
Pfadparameter
Anfrageparameter
Anfragetext
Antworttext
Beispielanfrage
- Basic

Aktualisiert die CachedContent-Ressource (nur Ablaufzeit kann aktualisiert werden).

Endpunkt

Patch https://generativelanguage.googleapis.com/v1beta/{cachedContent.name=cachedContents/*}

PATCH https://generativelanguage.googleapis.com/v1beta/{cachedContent.name=cachedContents/*}

Pfadparameter

cachedContent.name string

Optional. Kennung. Der Ressourcenname, der sich auf die im Cache gespeicherten Inhalte bezieht. Format: cachedContents/{id}. Sie hat das Format cachedContents/{cachedcontent}.

Abfrageparameter

updateMask string (FieldMask format)

Die Liste der zu aktualisierenden Felder.

Dies ist eine durch Kommas getrennte Liste vollständig qualifizierter Feldnamen. Beispiel: "user.displayName,photo".

Anfragetext

Der Anfragetext enthält eine Instanz von CachedContent.

Felder

expiration Union type

Gibt an, wann diese Ressource abläuft. Für expiration ist nur einer der folgenden Werte zulässig:

expireTime string (Timestamp format)

Der Zeitstempel in UTC, der angibt, wann diese Ressource als abgelaufen gilt. Dieser Wert wird immer bei der Ausgabe angegeben, unabhängig davon, was bei der Eingabe gesendet wurde.

ttl string (Duration format)

Nur Eingabe. Neue TTL für diese Ressource, nur Eingabe.

Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit "s". Beispiel: "3.5s".

name string

Optional. Kennung. Der Ressourcenname, der sich auf die im Cache gespeicherten Inhalte bezieht. Format: cachedContents/{id}

Beispielanfrage

Python

from google import genai
from google.genai import types
import datetime

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)

# Update the cache's time-to-live (ttl)
ttl = f"{int(datetime.timedelta(hours=2).total_seconds())}s"
client.caches.update(
    name=cache.name, config=types.UpdateCachedContentConfig(ttl=ttl)
)
print(f"After update:\n {cache}")

# Alternatively, update the expire_time directly
# Update the expire_time directly in valid RFC 3339 format (UTC with a "Z" suffix)
expire_time = (
    (
        datetime.datetime.now(datetime.timezone.utc)
        + datetime.timedelta(minutes=15)
    )
    .isoformat()
    .replace("+00:00", "Z")
)
client.caches.update(
    name=cache.name,
    config=types.UpdateCachedContentConfig(expire_time=expire_time),
)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

let cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});

// Update the cache's time-to-live (ttl)
const ttl = `${2 * 3600}s`; // 2 hours in seconds
cache = await ai.caches.update({
  name: cache.name,
  config: { ttl },
});
console.log("After update (TTL):", cache);

// Alternatively, update the expire_time directly (in RFC 3339 format with a "Z" suffix)
const expireTime = new Date(Date.now() + 15 * 60000)
  .toISOString()
  .replace(/\.\d{3}Z$/, "Z");
cache = await ai.caches.update({
  name: cache.name,
  config: { expireTime: expireTime },
});
console.log("After update (expire_time):", cache);cache.js

Ok

file, err := client.UploadFileFromPath(ctx,
	filepath.Join(testDataDir, "a11.txt"),
	&genai.UploadFileOptions{MIMEType: "text/plain"})
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)docs-snippets_test.go

Muschel

curl -X PATCH "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY" \
 -H 'Content-Type: application/json' \
 -d '{"ttl": "600s"}'cache.sh

Antworttext

Wenn der Vorgang erfolgreich abgeschlossen wurde, enthält der Antworttext eine Instanz von CachedContent.

Methode: cachedContents.delete

Endpunkt
Pfadparameter
Anfragetext
Antworttext
Beispielanfrage
- Basic

Löscht die Ressource „CachedContent“.

Endpunkt

delete https://generativelanguage.googleapis.com/v1beta/{name=cachedContents/*}

Pfadparameter

name string

Erforderlich. Der Ressourcenname, der sich auf den Inhaltscache-Eintrag bezieht. Format: cachedContents/{id}. Muss das Format cachedContents/{cachedcontent} haben.

Anfragetext

Der Anfragetext muss leer sein.

Beispielanfrage

Python

from google import genai

client = genai.Client()
document = client.files.upload(file=media / "a11.txt")
model_name = "gemini-1.5-flash-001"

cache = client.caches.create(
    model=model_name,
    config={
        "contents": [document],
        "system_instruction": "You are an expert analyzing transcripts.",
    },
)
client.caches.delete(name=cache.name)cache.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const filePath = path.join(media, "a11.txt");
const document = await ai.files.upload({
  file: filePath,
  config: { mimeType: "text/plain" },
});
console.log("Uploaded file name:", document.name);
const modelName = "gemini-1.5-flash-001";

const contents = [
  createUserContent(createPartFromUri(document.uri, document.mimeType)),
];

const cache = await ai.caches.create({
  model: modelName,
  config: {
    contents: contents,
    systemInstruction: "You are an expert analyzing transcripts.",
  },
});
await ai.caches.delete({ name: cache.name });
console.log("Cache deleted:", cache.name);cache.js

Ok

file, err := client.UploadFileFromPath(ctx,
	filepath.Join(testDataDir, "a11.txt"),
	&genai.UploadFileOptions{MIMEType: "text/plain"})
if err != nil {
	log.Fatal(err)
}
defer client.DeleteFile(ctx, file.Name)docs-snippets_test.go

Muschel

curl -X DELETE "https://generativelanguage.googleapis.com/v1beta/$CACHE_NAME?key=$GEMINI_API_KEY"cache.sh

Antworttext

Wenn der Vorgang erfolgreich abgeschlossen wurde, ist der Antworttext ein leeres JSON-Objekt.

REST-Ressource: cachedContents

Ressource: CachedContent

Inhalte, die vorverarbeitet wurden und in einer nachfolgenden Anfrage an den GenerativeService verwendet werden können.

Im Cache gespeicherte Inhalte können nur mit dem Modell verwendet werden, für das sie erstellt wurden.

Felder

contents[] object (Content)

Optional. Nur Eingabe. Nicht veränderbar. Die Inhalte, die im Cache gespeichert werden sollen.

tools[] object (Tool)

Optional. Nur Eingabe. Nicht veränderbar. Eine Liste von Tools, die das Modell zum Generieren der nächsten Antwort verwenden kann

createTime string (Timestamp format)

Nur Ausgabe. Erstellungszeit des Cache-Eintrags.

updateTime string (Timestamp format)

Nur Ausgabe. Der Zeitpunkt, zu dem der Cache-Eintrag zuletzt aktualisiert wurde, in UTC.

usageMetadata object (UsageMetadata)

Nur Ausgabe. Metadaten zur Nutzung der im Cache gespeicherten Inhalte.

expiration Union type

Gibt an, wann diese Ressource abläuft. Für expiration ist nur einer der folgenden Werte zulässig:

expireTime string (Timestamp format)

Der Zeitstempel in UTC, der angibt, wann diese Ressource als abgelaufen gilt. Dieser Wert wird immer bei der Ausgabe angegeben, unabhängig davon, was bei der Eingabe gesendet wurde.

ttl string (Duration format)

Nur Eingabe. Neue TTL für diese Ressource, nur Eingabe.

Die Dauer in Sekunden mit bis zu neun Nachkommastellen und am Ende mit "s". Beispiel: "3.5s".

name string

Optional. Kennung. Der Ressourcenname, der sich auf die im Cache gespeicherten Inhalte bezieht. Format: cachedContents/{id}

displayName string

Optional. Nicht veränderbar. Der vom Nutzer erstellte aussagekräftige Anzeigename der im Cache gespeicherten Inhalte. Maximal 128 Unicode-Zeichen.

model string

Erforderlich. Nicht veränderbar. Der Name der Model, die für zwischengespeicherte Inhalte verwendet werden soll. Format: models/{model}

systemInstruction object (Content)

Optional. Nur Eingabe. Nicht veränderbar. Systemanweisung des Entwicklers. Derzeit nur Text.

toolConfig object (ToolConfig)

Optional. Nur Eingabe. Nicht veränderbar. Toolkonfiguration Diese Konfiguration wird für alle Tools verwendet.

JSON-Darstellung

JSON-Darstellung
{ "contents": [ { object (`Content`) } ], "tools": [ { object (`Tool`) } ], "createTime": string, "updateTime": string, "usageMetadata": { object (`UsageMetadata`) }, // expiration "expireTime": string, "ttl": string // Union type "name": string, "displayName": string, "model": string, "systemInstruction": { object (`Content`) }, "toolConfig": { object (`ToolConfig`) } }

{
  "contents": [
    {
      object (Content)
    }
  ],
  "tools": [
    {
      object (Tool)
    }
  ],
  "createTime": string,
  "updateTime": string,
  "usageMetadata": {
    object (UsageMetadata)
  },

  // expiration
  "expireTime": string,
  "ttl": string
  // Union type
  "name": string,
  "displayName": string,
  "model": string,
  "systemInstruction": {
    object (Content)
  },
  "toolConfig": {
    object (ToolConfig)
  }
}

Inhalt

Der grundlegende strukturierte Datentyp, der mehrteilige Inhalte einer Nachricht enthält.

Eine Content enthält ein role-Feld, das den Ersteller der Content angibt, und ein parts-Feld mit mehrteiligen Daten, die den Inhalt der Nachrichtenrunde enthalten.

Felder

parts[] object (Part)

Sortierte Parts, die eine einzelne Nachricht bilden. Teile können unterschiedliche MIME-Typen haben.

role string

Optional. Der Ersteller der Inhalte. Muss entweder „user“ oder „model“ sein.

Nützlich für Unterhaltungen mit mehreren Themen, kann andernfalls leer bleiben oder nicht festgelegt werden.

JSON-Darstellung
{ "parts": [ { object (`Part`) } ], "role": string }

Teil

Ein Datentyp mit Medien, die Teil einer mehrteiligen Content-Nachricht sind.

Ein Part besteht aus Daten, die mit einem Datentyp verknüpft sind. Ein Part kann nur einen der in Part.data zulässigen Typen enthalten.

Ein Part muss einen festen IANA-MIME-Typ haben, der den Typ und den Untertyp der Medien angibt, wenn das Feld inlineData mit Rohbytes gefüllt ist.

Felder

data Union type

Für data ist nur einer der folgenden Werte zulässig:

text string

Inline-Text

inlineData object (Blob)

Inline-Medien-Byte.

functionCall object (FunctionCall)

Ein vorhergesagter FunctionCall, der vom Modell zurückgegeben wird und einen String enthält, der FunctionDeclaration.name mit den Argumenten und ihren Werten darstellt.

functionResponse object (FunctionResponse)

fileData object (FileData)

URI-basierte Daten.

executableCode object (ExecutableCode)

Vom Modell generierter Code, der ausgeführt werden soll.

codeExecutionResult object (CodeExecutionResult)

Ergebnis der Ausführung der ExecutableCode.

JSON-Darstellung

JSON-Darstellung
{ // data "text": string, "inlineData": { object (`Blob`) }, "functionCall": { object (`FunctionCall`) }, "functionResponse": { object (`FunctionResponse`) }, "fileData": { object (`FileData`) }, "executableCode": { object (`ExecutableCode`) }, "codeExecutionResult": { object (`CodeExecutionResult`) } // Union type }

{

  // data
  "text": string,
  "inlineData": {
    object (Blob)
  },
  "functionCall": {
    object (FunctionCall)
  },
  "functionResponse": {
    object (FunctionResponse)
  },
  "fileData": {
    object (FileData)
  },
  "executableCode": {
    object (ExecutableCode)
  },
  "codeExecutionResult": {
    object (CodeExecutionResult)
  }
  // Union type
}

Blob

Rohe Media-Bytes.

Text darf nicht als Rohbytes gesendet werden. Verwenden Sie stattdessen das Feld „text“.

Felder

mimeType string

Der IANA-Standard-MIME-Typ der Quelldaten. Beispiele: - image/png - image/jpeg Wenn ein nicht unterstützter MIME-Typ angegeben wird, wird ein Fehler zurückgegeben. Eine vollständige Liste der unterstützten Typen finden Sie unter Unterstützte Dateiformate.

data string (bytes format)

Rohbytes für Medienformate.

Ein base64-codierter String.

JSON-Darstellung
{ "mimeType": string, "data": string }

FunctionCall

Ein vorhergesagter FunctionCall, der vom Modell zurückgegeben wird und einen String enthält, der FunctionDeclaration.name mit den Argumenten und ihren Werten darstellt.

Felder

id string

Optional. Die eindeutige ID des Funktionsaufrufs. Wenn ein Wert angegeben ist, führt der Client die functionCall aus und gibt die Antwort mit der übereinstimmenden id zurück.

name string

Erforderlich. Der Name der aufzurufenden Funktion. Muss a–z, A–Z, 0–9 sein oder Unterstriche und Bindestriche enthalten. Die maximale Länge beträgt 63.

args object (Struct format)

Optional. Die Funktionsparameter und ‑werte im JSON-Objektformat.

JSON-Darstellung
{ "id": string, "name": string, "args": { object } }

FunctionResponse

Die Ergebnisausgabe einer FunctionCall, die einen String enthält, der FunctionDeclaration.name darstellt, und ein strukturiertes JSON-Objekt mit der Ausgabe der Funktion, wird als Kontext für das Modell verwendet. Dieser sollte das Ergebnis einerFunctionCall enthalten, die auf der Modellvorhersage basiert.

Felder

id string

Optional. Die ID des Funktionsaufrufs, für den diese Antwort bestimmt ist. Wird vom Client ausgefüllt, um dem entsprechenden Funktionsaufruf id zu entsprechen.

name string

Erforderlich. Der Name der aufzurufenden Funktion. Muss a–z, A–Z, 0–9 sein oder Unterstriche und Bindestriche enthalten. Die maximale Länge beträgt 63.

response object (Struct format)

Erforderlich. Die Funktionsantwort im JSON-Objektformat.

JSON-Darstellung
{ "id": string, "name": string, "response": { object } }

FileData

URI-basierte Daten.

Felder

mimeType string

Optional. Der IANA-Standard-MIME-Typ der Quelldaten.

fileUri string

Erforderlich. URI.

JSON-Darstellung


{
  "mimeType": string,
  "fileUri": string
}

JSON-Darstellung
{ "mimeType": string, "fileUri": string }

ExecutableCode

Vom Modell generierter Code, der ausgeführt werden soll, und das Ergebnis, das an das Modell zurückgegeben wird.

Wird nur generiert, wenn das CodeExecution-Tool verwendet wird, in dem der Code automatisch ausgeführt und ein entsprechender CodeExecutionResult generiert wird.

Felder

language enum (Language)

Erforderlich. Programmiersprache der code.

code string

Erforderlich. Der Code, der ausgeführt werden soll.

JSON-Darstellung
{ "language": enum (`Language`), "code": string }

Sprache

Unterstützte Programmiersprachen für den generierten Code.

Enums
`LANGUAGE_UNSPECIFIED`	Sprache nicht bekannt. Dieser Wert sollte nicht verwendet werden.
`PYTHON`	Python >= 3.10 mit numpy und simpy

CodeExecutionResult

Ergebnis der Ausführung der ExecutableCode.

Wird nur bei Verwendung des CodeExecution generiert und folgt immer einem part, das die ExecutableCode enthält.

Felder

outcome enum (Outcome)

Erforderlich. Ergebnis der Codeausführung.

output string

Optional. Enthält stderr oder eine andere Beschreibung, wenn die Codeausführung fehlgeschlagen ist, andernfalls stdout.

JSON-Darstellung
{ "outcome": enum (`Outcome`), "output": string }

Ergebnis

Aufzählung der möglichen Ergebnisse der Codeausführung.

Enums
`OUTCOME_UNSPECIFIED`	Nicht angegebener Status. Dieser Wert sollte nicht verwendet werden.
`OUTCOME_OK`	Die Codeausführung wurde erfolgreich abgeschlossen.
`OUTCOME_FAILED`	Die Codeausführung ist mit einem Fehler abgeschlossen. `stderr` sollte den Grund enthalten.
`OUTCOME_DEADLINE_EXCEEDED`	Die Codeausführung dauerte zu lange und wurde abgebrochen. Es kann eine teilweise Ausgabe vorhanden sein oder nicht.

Tool

Tooldetails, die das Modell zum Generieren einer Antwort verwenden kann.

Ein Tool ist ein Code, der es dem System ermöglicht, mit externen Systemen zu interagieren, um eine Aktion oder eine Reihe von Aktionen außerhalb des Wissens und Umfangs des Modells auszuführen.

Felder

functionDeclarations[] object (FunctionDeclaration)

Optional. Eine Liste der für das Modell verfügbaren FunctionDeclarations, die für den Funktionsaufruf verwendet werden können.

Das Modell oder System führt die Funktion nicht aus. Stattdessen kann die definierte Funktion als FunctionCall mit Argumenten zur Ausführung an die Clientseite zurückgegeben werden. Das Modell kann entscheiden, einen Teil dieser Funktionen aufzurufen, indem es FunctionCall in die Antwort einfügt. Der nächste Gesprächsschritt kann eine FunctionResponse mit dem Content.role-Generierungskontext „function“ für den nächsten Modellschritt enthalten.

googleSearchRetrieval object (GoogleSearchRetrieval)

Optional. Abruftool, das auf der Google Suche basiert.

codeExecution object (CodeExecution)

Optional. Ermöglicht es dem Modell, Code im Rahmen der Generierung auszuführen.

googleSearch object (GoogleSearch)

Optional. Google Suche-Tooltyp Tool zur Unterstützung der Google Suche im Modell. Powered by Google

JSON-Darstellung

JSON-Darstellung
{ "functionDeclarations": [ { object (`FunctionDeclaration`) } ], "googleSearchRetrieval": { object (`GoogleSearchRetrieval`) }, "codeExecution": { object (`CodeExecution`) }, "googleSearch": { object (`GoogleSearch`) } }

{
  "functionDeclarations": [
    {
      object (FunctionDeclaration)
    }
  ],
  "googleSearchRetrieval": {
    object (GoogleSearchRetrieval)
  },
  "codeExecution": {
    object (CodeExecution)
  },
  "googleSearch": {
    object (GoogleSearch)
  }
}

FunctionDeclaration

Strukturierte Darstellung einer Funktionsdeklaration gemäß der Definition der OpenAPI 3.03-Spezifikation. Diese Deklaration enthält den Funktionsnamen und die Parameter. Diese FunctionDeclaration ist eine Darstellung eines Codeblocks, der vom Modell als Tool verwendet und vom Client ausgeführt werden kann.

Felder

name string

Erforderlich. Der Name der Funktion. Muss a–z, A–Z, 0–9 sein oder Unterstriche und Bindestriche enthalten. Die maximale Länge beträgt 63.

description string

Erforderlich. Eine kurze Beschreibung der Funktion.

parameters object (Schema)

Optional. Hier werden die Parameter dieser Funktion beschrieben. Entspricht dem String-Schlüssel des Open API 3.03-Parameterobjekts: dem Namen des Parameters. Bei Parameternamen wird die Groß- und Kleinschreibung beachtet. Schemawert: Das Schema, das den für den Parameter verwendeten Typ definiert.

response object (Schema)

Optional. Beschreibt die Ausgabe dieser Funktion im JSON-Schema-Format. Entspricht dem Open API 3.03-Antwortobjekt. Das Schema definiert den Typ, der für den Antwortwert der Funktion verwendet wird.

JSON-Darstellung
{ "name": string, "description": string, "parameters": { object (`Schema`) }, "response": { object (`Schema`) } }

Schema

Mit dem Schema-Objekt können Eingabe- und Ausgabedatentypen definiert werden. Diese Typen können Objekte, aber auch primitive Typen und Arrays sein. Stellt eine ausgewählte Teilmenge eines OpenAPI 3.0-Schemaobjekts dar.

Felder

type enum (Type)

Erforderlich. Datentyp

format string

Optional. Das Format der Daten. Diese Option wird nur für primitive Datentypen verwendet. Unterstützte Formate: für den ZAHLENRTYP: float, double für den INTEGERTYP: int32, int64 für den STRINGTYP: enum, dateTime

title string

Optional. Der Titel des Schemas.

description string

Optional. Eine kurze Beschreibung des Parameters. Dies kann auch Anwendungsbeispiele enthalten. Die Parameterbeschreibung kann im Markdown-Format formatiert sein.

nullable boolean

Optional. Gibt an, ob der Wert null sein kann.

enum[] string

Optional. Mögliche Werte des Elements „Type.STRING“ im enum-Format. So können wir beispielsweise eine Enum-Richtung so definieren : {type:STRING, format:enum, enum:["OST", "NORD", "SÜD", "WEST"]}

maxItems string (int64 format)

Optional. Maximale Anzahl der Elemente für „Type.ARRAY“.

minItems string (int64 format)

Optional. Mindestanzahl der Elemente für „Type.ARRAY“.

properties map (key: string, value: object (Schema))

Optional. Eigenschaften von „Type.OBJECT“

Ein Objekt, das eine Liste von "key": value-Paaren enthält. Beispiel: { "name": "wrench", "mass": "1.3kg", "count": "3" }.

required[] string

Optional. Erforderliche Properties von „Type.OBJECT“

anyOf[] object (Schema)

Optional. Der Wert sollte anhand eines oder mehrerer der Unterschemata in der Liste validiert werden.

propertyOrdering[] string

Optional. Die Reihenfolge der Properties. Kein Standardfeld in der OpenAPI-Spezifikation. Wird verwendet, um die Reihenfolge der Properties in der Antwort zu bestimmen.

items object (Schema)

Optional. Schema der Elemente vom Typ „ARRAY“.

minimum number

Optional. SCHEMAFELDERN FÜR DEN TYP INTEGER UND NUMBER Mindestwert von „Type.INTEGER“ und „Type.NUMBER“

maximum number

Optional. Maximaler Wert von „Ganzzahl“ und „Zahl“

JSON-Darstellung

JSON-Darstellung
{ "type": enum (`Type`), "format": string, "title": string, "description": string, "nullable": boolean, "enum": [ string ], "maxItems": string, "minItems": string, "properties": { string: { object (`Schema`) }, ... }, "required": [ string ], "anyOf": [ { object (`Schema`) } ], "propertyOrdering": [ string ], "items": { object (`Schema`) }, "minimum": number, "maximum": number }

{
  "type": enum (Type),
  "format": string,
  "title": string,
  "description": string,
  "nullable": boolean,
  "enum": [
    string
  ],
  "maxItems": string,
  "minItems": string,
  "properties": {
    string: {
      object (Schema)
    },
    ...
  },
  "required": [
    string
  ],
  "anyOf": [
    {
      object (Schema)
    }
  ],
  "propertyOrdering": [
    string
  ],
  "items": {
    object (Schema)
  },
  "minimum": number,
  "maximum": number
}

Typ

„Typ“ enthält die Liste der OpenAPI-Datentypen gemäß https://spec.openapis.org/oas/v3.0.3#data-types.

Enums
`TYPE_UNSPECIFIED`	Nicht angegeben, sollte nicht verwendet werden.
`STRING`	Stringtyp.
`NUMBER`	Nummerntyp.
`INTEGER`	Ganzzahltyp.
`BOOLEAN`	Boolescher Typ.
`ARRAY`	Arraytyp.
`OBJECT`	Objekttyp.

GoogleSearchRetrieval

Von Google entwickeltes Tool zum Abrufen öffentlicher Webdaten für die Datengrundlage.

Felder

dynamicRetrievalConfig object (DynamicRetrievalConfig)

Gibt die Konfiguration für den dynamischen Abruf für die angegebene Quelle an.

JSON-Darstellung
{ "dynamicRetrievalConfig": { object (`DynamicRetrievalConfig`) } }

DynamicRetrievalConfig

Hier werden die Optionen zum Anpassen der dynamischen Abfrage beschrieben.

Felder

mode enum (Mode)

Der Modus des Vorhersagemodells, der beim dynamischen Abrufen verwendet werden soll.

dynamicThreshold number

Der Schwellenwert, der beim dynamischen Abrufen verwendet werden soll. Wenn dieser Wert nicht festgelegt ist, wird ein Systemstandardwert verwendet.

JSON-Darstellung
{ "mode": enum (`Mode`), "dynamicThreshold": number }

Modus

Der Modus des Vorhersagemodells, der beim dynamischen Abrufen verwendet werden soll.

Enums
`MODE_UNSPECIFIED`	Rufen Sie den Abruf immer ab.
`MODE_DYNAMIC`	Die Daten werden nur dann abgerufen, wenn das System dies für erforderlich hält.

CodeExecution

Dieser Typ hat keine Felder.

Tool, das vom Modell generierten Code ausführt und das Ergebnis automatisch an das Modell zurückgibt.

Weitere Informationen finden Sie unter ExecutableCode und CodeExecutionResult, die nur bei Verwendung dieses Tools generiert werden.

GoogleSearch

Dieser Typ hat keine Felder.

Google Suche-Tooltyp Tool zur Unterstützung der Google Suche im Modell. Powered by Google

ToolConfig

Die Toolkonfiguration mit Parametern zur Angabe der Verwendung von Tool in der Anfrage.

Felder

functionCallingConfig object (FunctionCallingConfig)

Optional. Konfiguration für Funktionsaufrufe

JSON-Darstellung
{ "functionCallingConfig": { object (`FunctionCallingConfig`) } }

FunctionCallingConfig

Konfiguration zum Angeben des Verhaltens von Funktionsaufrufen.

Felder

mode enum (Mode)

Optional. Gibt den Modus an, in dem der Funktionsaufruf ausgeführt werden soll. Wenn Sie keinen Wert angeben, wird der Standardwert „AUTO“ verwendet.

allowedFunctionNames[] string

Optional. Eine Reihe von Funktionsnamen, die die vom Modell aufgerufenen Funktionen einschränken.

Diese Einstellung sollte nur festgelegt werden, wenn der Modus „JEDER“ ist. Funktionsnamen müssen mit [FunctionDeclaration.name] übereinstimmen. Wenn der Modus auf „JEDER“ festgelegt ist, prognostiziert das Modell einen Funktionsaufruf aus den angegebenen Funktionsnamen.

JSON-Darstellung
{ "mode": enum (`Mode`), "allowedFunctionNames": [ string ] }

Modus

Hiermit wird das Ausführungsverhalten für den Funktionsaufruf durch Festlegen des Ausführungsmodus definiert.

Enums
`MODE_UNSPECIFIED`	Nicht angegebener Modus für Funktionsaufrufe. Dieser Wert sollte nicht verwendet werden.
`AUTO`	Standardverhalten des Modells: Das Modell entscheidet, ob ein Funktionsaufruf oder eine Antwort in natürlicher Sprache vorhergesagt werden soll.
`ANY`	Das Modell ist darauf beschränkt, immer nur einen Funktionsaufruf vorherzusagen. Wenn „allowedFunctionNames“ festgelegt ist, wird der vorhergesagte Funktionsaufruf auf eine der „allowedFunctionNames“ beschränkt. Andernfalls wird der vorhergesagte Funktionsaufruf auf eine der bereitgestellten „functionDeclarations“ beschränkt.
`NONE`	Das Modell prognostiziert keinen Funktionsaufruf. Das Modellverhalten ist dann dasselbe wie bei keiner Funktionsdeklaration.

UsageMetadata

Metadaten zur Nutzung der im Cache gespeicherten Inhalte.

Felder

totalTokenCount integer

Die Gesamtzahl der Tokens, die für die im Cache gespeicherten Inhalte benötigt werden.

JSON-Darstellung
{ "totalTokenCount": integer }