Dosyalar API'si

Gemini, metin, resim ve ses gibi çeşitli giriş verilerini aynı anda işleyebilir.

Bu kılavuzda, Files API'yi kullanarak medya dosyalarıyla nasıl çalışacağınız gösterilmektedir. Ses dosyaları, resimler, videolar, dokümanlar ve desteklenen diğer dosya türleri için temel işlemler aynıdır.

Dosya istemiyle ilgili rehberlik için Dosya istemi kılavuzu bölümüne göz atın.

Dosya yükleyin

Medya dosyası yüklemek için Files API'yi kullanabilirsiniz. Toplam istek boyutu (dosyalar, metin istemi, sistem talimatları vb. dahil) 100 MB'tan büyük olduğunda her zaman Files API'yi kullanın. PDF dosyaları için sınır 50 MB'tır.

Aşağıdaki kod, bir dosyayı yükler ve ardından generateContent çağrısında kullanır.

Python

from google import genai

client = genai.Client()

myfile = client.files.upload(file="path/to/sample.mp3")

response = client.models.generate_content(
    model="gemini-3-flash-preview", contents=["Describe this audio clip", myfile]
)

print(response.text)

JavaScript

import {
  GoogleGenAI,
  createUserContent,
  createPartFromUri,
} from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const myfile = await ai.files.upload({
    file: "path/to/sample.mp3",
    config: { mimeType: "audio/mpeg" },
  });

  const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: createUserContent([
      createPartFromUri(myfile.uri, myfile.mimeType),
      "Describe this audio clip",
    ]),
  });
  console.log(response.text);
}

await main();

Go

file, err := client.Files.UploadFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}
defer client.Files.Delete(ctx, file.Name)

resp, err := client.Models.GenerateContent(ctx, "gemini-3-flash-preview", []*genai.Content{
  {
    Parts: []*genai.Part{
      genai.NewPartFromFile(*file),
      genai.NewPartFromText("Describe this audio clip"),
    },
  },
}, nil)

if err != nil {
    log.Fatal(err)
}

printResponse(resp)

REST

AUDIO_PATH="path/to/sample.mp3"
MIME_TYPE=$(file -b --mime-type "${AUDIO_PATH}")
NUM_BYTES=$(wc -c < "${AUDIO_PATH}")
DISPLAY_NAME=AUDIO

tmp_header_file=upload-header.tmp

# Initial resumable request defining metadata.
# The upload url is in the response headers dump them to a file.
curl "${BASE_URL}/upload/v1beta/files" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -D "${tmp_header_file}" \
  -H "X-Goog-Upload-Protocol: resumable" \
  -H "X-Goog-Upload-Command: start" \
  -H "X-Goog-Upload-Header-Content-Length: ${NUM_BYTES}" \
  -H "X-Goog-Upload-Header-Content-Type: ${MIME_TYPE}" \
  -H "Content-Type: application/json" \
  -d "{'file': {'display_name': '${DISPLAY_NAME}'}}" 2> /dev/null

upload_url=$(grep -i "x-goog-upload-url: " "${tmp_header_file}" | cut -d" " -f2 | tr -d "\r")
rm "${tmp_header_file}"

# Upload the actual bytes.
curl "${upload_url}" \
  -H "Content-Length: ${NUM_BYTES}" \
  -H "X-Goog-Upload-Offset: 0" \
  -H "X-Goog-Upload-Command: upload, finalize" \
  --data-binary "@${AUDIO_PATH}" 2> /dev/null > file_info.json

file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri

# Now generate content using that file
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -X POST \
    -d '{
      "contents": [{
        "parts":[
          {"text": "Describe this audio clip"},
          {"file_data":{"mime_type": "${MIME_TYPE}", "file_uri": '$file_uri'}}]
        }]
      }' 2> /dev/null > response.json

cat response.json
echo

jq ".candidates[].content.parts[].text" response.json

Dosyanın meta verilerini alma

files.get işlevini çağırarak API'nin yüklenen dosyayı başarıyla depoladığını doğrulayabilir ve dosyanın meta verilerini alabilirsiniz.

Python

from google import genai

client = genai.Client()

myfile = client.files.upload(file='path/to/sample.mp3')
file_name = myfile.name
myfile = client.files.get(name=file_name)
print(myfile)

JavaScript

import {
  GoogleGenAI,
} from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const myfile = await ai.files.upload({
    file: "path/to/sample.mp3",
    config: { mimeType: "audio/mpeg" },
  });

  const fileName = myfile.name;
  const fetchedFile = await ai.files.get({ name: fileName });
  console.log(fetchedFile);
}

await main();

Go

file, err := client.Files.UploadFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}

gotFile, err := client.Files.Get(ctx, file.Name)
if err != nil {
    log.Fatal(err)
}
fmt.Println("Got file:", gotFile.Name)

REST

# file_info.json was created in the upload example
name=$(jq ".file.name" file_info.json)
# Get the file of interest to check state
curl https://generativelanguage.googleapis.com/v1beta/files/$name \
-H "x-goog-api-key: $GEMINI_API_KEY" > file_info.json
# Print some information about the file you got
name=$(jq ".file.name" file_info.json)
echo name=$name
file_uri=$(jq ".file.uri" file_info.json)
echo file_uri=$file_uri

Yüklenen dosyaları listeleme

Aşağıdaki kod, yüklenen tüm dosyaların listesini alır:

Python

from google import genai

client = genai.Client()

print('My files:')
for f in client.files.list():
    print(' ', f.name)

JavaScript

import {
  GoogleGenAI,
} from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const listResponse = await ai.files.list({ config: { pageSize: 10 } });
  for await (const file of listResponse) {
    console.log(file.name);
  }
}

await main();

Go

for file, err := range client.Files.All(ctx) {
  if err != nil {
    log.Fatal(err)
  }
  fmt.Println(file.Name)
}

REST

echo "My files: "

curl "https://generativelanguage.googleapis.com/v1beta/files" \
  -H "x-goog-api-key: $GEMINI_API_KEY"

Yüklenen dosyaları silme

Dosyalar 48 saat sonra otomatik olarak silinir. Yüklenen bir dosyayı manuel olarak da silebilirsiniz:

Python

from google import genai

client = genai.Client()

myfile = client.files.upload(file='path/to/sample.mp3')
client.files.delete(name=myfile.name)

JavaScript

import {
  GoogleGenAI,
} from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const myfile = await ai.files.upload({
    file: "path/to/sample.mp3",
    config: { mimeType: "audio/mpeg" },
  });

  const fileName = myfile.name;
  await ai.files.delete({ name: fileName });
}

await main();

Go

file, err := client.Files.UploadFromPath(ctx, "path/to/sample.mp3", nil)
if err != nil {
    log.Fatal(err)
}
client.Files.Delete(ctx, file.Name)

REST

curl --request "DELETE" https://generativelanguage.googleapis.com/v1beta/files/$name \
  -H "x-goog-api-key: $GEMINI_API_KEY"

Kullanım bilgileri

Medya dosyalarını yüklemek ve bu dosyalarla etkileşim kurmak için Files API'yi kullanabilirsiniz. Files API, proje başına 20 GB'a kadar dosya depolamanıza olanak tanır. Dosya başına maksimum boyut 2 GB'tır. Dosyalar 48 saat boyunca saklanır. Bu süre zarfında, dosyalarla ilgili meta verileri almak için API'yi kullanabilirsiniz ancak dosyaları indiremezsiniz. Files API, Gemini API'nin kullanılabildiği tüm bölgelerde ücretsiz olarak kullanılabilir.

Dosya istemi stratejileri

Bu bölümde, Gemini API için istemlerle medya dosyalarını kullanmayla ilgili rehberlik ve en iyi uygulamalar yer almaktadır.

İstemlerinizde çeşitli veri türlerini kullanabilmek, Gemini API ile hangi görevleri yapabileceğiniz konusunda daha fazla esneklik sağlar. Örneğin, modele lezzetli bir yemeğin fotoğrafını gönderip yemekle ilgili kısa bir blog yazmasını isteyebilirsiniz.

İstem

Yanıt

Bu resme dayalı kısa ve ilgi çekici bir blog yayını yaz. Fotoğraftaki yemeğin açıklamasını içermeli ve yemek hazırlama yolculuğumdan bahsetmelidir.

Yemek hazırlığı, hem zamandan hem de paradan tasarruf etmenin harika bir yoludur ve daha sağlıklı beslenmenize de yardımcı olabilir. Bu yemek, önceden kolayca hazırlanabilen sağlıklı ve lezzetli bir yemeğin harika bir örneğidir.

Bu öğünde kahverengi pirinç, fırında sebzeler ve teriyaki soslu tavuk bulunur. Esmer pirinç, size uzun süreli enerji verecek sağlıklı ve kompleks bir karbonhidrattır. Kızartılmış sebzeler, günlük vitamin ve mineral ihtiyacınızı karşılamak için harika bir seçenektir. Teriyaki soslu tavuk ise lezzetli ve protein açısından zengin bir alternatiftir.

Bu yemeği hazırlamak da çok kolaydır. Kahverengi pirinci pişirin, sebzeleri fırında kızartın ve teriyaki soslu tavuğu pişirin. Her şey piştikten sonra, yemek hazırlama kaplarına bölüp buzdolabında saklayın. Ardından, yoğun sabahlarınızda bir kap alıp çıkabilirsiniz.

Önceden kolayca hazırlanabilen sağlıklı ve lezzetli bir öğün arıyorsanız bu yemek tam size göre. Besinler ve lezzetlerle dolu bu yemek, sizi tok ve memnun hissettirecek.

Sağlıklı ve lezzetli yemek hazırlama!

Medya dosyalarının kullanıldığı istemlerden istediğiniz çıktıyı almakta zorlanıyorsanız istediğiniz sonuçları elde etmenize yardımcı olabilecek bazı stratejiler vardır. Aşağıdaki bölümlerde, çok formatlı giriş kullanan istemleri iyileştirmeye yönelik tasarım yaklaşımları ve sorun giderme ipuçları verilmektedir.

Aşağıdaki en iyi uygulamaları izleyerek çok formatlı istemlerinizi iyileştirebilirsiniz:

İstem tasarımıyla ilgili temel bilgiler
- Talimatlarınızda net olun: Yanlış yorumlamaya en az yer bırakacak şekilde net ve kısa talimatlar oluşturun.
- İsteminize birkaç örnek ekleyin: Ne elde etmek istediğinizi göstermek için gerçekçi birkaç görev örneği kullanın.
- Adım adım ilerleyin: Karmaşık görevleri yönetilebilir alt hedeflere ayırarak modele süreç boyunca rehberlik edin.
- Çıkış biçimini belirtin: İsteminizde, çıkışın istediğiniz biçimde (ör. Markdown, JSON, HTML) olmasını isteyin.
- Tek resimli istemlerde resminizi ilk sıraya yerleştirin: Gemini, resim ve metin girişlerini herhangi bir sırada işleyebilse de tek resim içeren istemlerde, resim (veya video) metin isteminden önce yerleştirilirse daha iyi performans gösterebilir. Ancak, anlamlı olması için resimlerin metinlerle yoğun bir şekilde iç içe geçmesini gerektiren istemlerde en doğal olan sırayı kullanın.
Çok formatlı isteminizle ilgili sorunları giderme
- Model, resmin alakalı bölümünden bilgi almıyorsa: İstemden bilgi almasını istediğiniz resmin hangi yönleriyle ilgili ipuçları verin.
- Model çıkışı çok genel ise (resim/video girişine yeterince uyarlanmamışsa): İstemin başında, görev talimatını vermeden önce modelden resimleri veya videoyu açıklamasını ya da resimde ne olduğunu belirtmesini isteyin.
- Hangi bölümün başarısız olduğunu belirlemek için: Modelin ilk anlayışını ölçmek üzere modelden resmi açıklamasını veya gerekçesini açıklamasını isteyin.
- İsteminiz halüsinasyon içeren içeriklerle sonuçlanıyorsa: Sıcaklık ayarını düşürmeyi veya modelden daha kısa açıklamalar istemeyi deneyin. Böylece modelin ek ayrıntılar eklemesi daha az olasıdır.
- Örnekleme parametrelerini ayarlama: Modelin yaratıcılığını ayarlamak için farklı sıcaklık ayarları ve top-k seçimleriyle denemeler yapın.
  Gemini 3 modellerini kullanırken temperature değerini varsayılan değer olan 1, 0'da tutmanızı önemle tavsiye ederiz. Sıcaklığı değiştirme (1, 0'ın altına ayarlama), özellikle karmaşık matematiksel veya muhakeme görevlerinde döngüye girme ya da performansın düşmesi gibi beklenmedik davranışlara yol açabilir.

Talimatlarınızda net olun

İstemler en iyi sonucu net ve ayrıntılı olduğunda verir. Aklınızda belirli bir çıktı varsa istediğiniz çıktıyı elde etmek için bu şartı isteme eklemeniz daha iyi olur.

Havaalanı panosunun yer aldığı bu resim için modele yalnızca "bu resmi açıkla" komutunu verdiğinizde genel bir açıklama oluşturulabilir. Modelin resimdeki saati ve şehri ayrıştırmasını istiyorsanız bu isteği doğrudan isteminize ekleyebilirsiniz.

İstem	Model yanıtı
Bu resmi tanımla.	Resimde, havalimanındaki gelen ve giden uçuşlar tabelası gösteriliyor.

Güncellenen istem	İyileştirilmiş yanıt
Parse the time and city from the airport board shown in this image into a list.	10:50 Moskova 11:05 Edinburgh 11:05 Londra 11:10 Bükreş 11:30 Kiev 11:35 Dublin 11:45 East Midlands 12:15 Sofia 12:30 Londra 12:30 Newcastle 12:40 St Petersburg 12:40 Londra 12:45 Manchester

Güncellenen istem

İyileştirilmiş yanıt

Parse the time and city from the airport board shown in this image into a list.

10:50 Moskova

11:05 Edinburgh

11:05 Londra

11:10 Bükreş

11:30 Kiev

11:35 Dublin

11:45 East Midlands

12:15 Sofia

12:30 Londra

12:30 Newcastle

12:40 St Petersburg

12:40 Londra

12:45 Manchester

Birkaç örnek ekleyin

Gemini modeli, istediğiniz çıkışı anlamak için örnek olarak kullanabileceği birden fazla giriş kabul edebilir. Bu örnekleri eklemek, modelin kalıpları belirlemesine ve verilen resimler ile yanıtlar arasındaki ilişkiyi yeni örneğe uygulamasına yardımcı olabilir. Bu, "az görevli" öğrenme olarak da adlandırılır.

Aşağıdaki örnekte, ilk çıkış cümle şeklinde yazılmış ve ülke (Brezilya) bilgisi de yer alıyor. Çıktının farklı bir biçimde veya stilde olmasını ve yalnızca şehri (ülkeyi değil) istiyorsanız. İsteminize birkaç görev örneği eklemek, modelin istediğiniz şekilde yanıt vermesini sağlayabilir.

İstem	Model yanıtı
Simge yapının bulunduğu şehri belirleyin.	Bu simge yapı, Brezilya'nın Rio de Janeiro şehrindeki Kurtarıcı İsa heykeli.

Güncellenen istem	İyileştirilmiş yanıt
Simge yapının bulunduğu şehri belirleyin.	city: Rome, landmark: the Colosseum.
	city: Beijing, landmark: Forbidden City
	city: Rio de Janeiro, landmark: Christ the Redeemer statue

Adım adım açıklama

Hem görsel anlayış hem de akıl yürütme gerektiren görevler gibi karmaşık görevleri daha küçük ve basit adımlara bölmek faydalı olabilir. Alternatif olarak, isteminizde doğrudan modelden "adım adım düşünmesini" istemek de etkili olabilir.

İstem	Model yanıtı
Tuvalet kağıdım ne zaman bitecek?	Yakında yalnızca 3 film rulosu hakkınız kalacak.

Güncellenen istem	İyileştirilmiş yanıt
1. Öncelikle bu resimde kaç rulo tuvalet kağıdı olduğunu sayın. 2. Ardından, bir kişinin günde ne kadar tuvalet kağıdı kullandığını belirleyin. 3. Bu tuvalet kağıdı rulolarının ne kadar süre dayanacağını hesaplayın.	1. Bu resimde 3 rulo tuvalet kağıdı var. 2. Bir kişi günde yaklaşık 20 yaprak tuvalet kağıdı kullanır. 3. Her ruloda 200 yaprak varsa her rulo yaklaşık 10 gün dayanır. Bu nedenle, 3 rulo yaklaşık bir ay dayanır.

Güncellenen istem

İyileştirilmiş yanıt

1. Öncelikle bu resimde kaç rulo tuvalet kağıdı olduğunu sayın.

2. Ardından, bir kişinin günde ne kadar tuvalet kağıdı kullandığını belirleyin.

3. Bu tuvalet kağıdı rulolarının ne kadar süre dayanacağını hesaplayın.

1. Bu resimde 3 rulo tuvalet kağıdı var.

2. Bir kişi günde yaklaşık 20 yaprak tuvalet kağıdı kullanır.

3. Her ruloda 200 yaprak varsa her rulo yaklaşık 10 gün dayanır. Bu nedenle, 3 rulo yaklaşık bir ay dayanır.

Matematik problemleri veya diğer sözel problemler, modele adım adım düşünmesini söylemek için idealdir.

İstem	Yanıt
Dizideki 4. terim nedir?	-135

İstem

Yanıt

Dizideki 4. terim nedir?

-135

Modelin yanıtı yanlış. Bunu iyileştirmenin bazı yolları, modelden isteme yanıt vermeden önce problemi ayrıştırmasını istemektir.

İstem	Yanıt
Önce resimdeki formülü ayrıştırın. Ardından, formüle göre "Dizideki 4. terim nedir?" sorusunu yanıtlayın.	Sonucu genişletmek için tıklayın $$ b(n) = b(n-1) * (-3) $$ $$ b(1) = 15 $$ Formülde n = 4 değerini kullanın: $$ b(4) = b(4-1) * (-3) $$ $$ b(4) = b(3) * (-3) $$ b(3) değerini bilmiyoruz. Bu nedenle, n = 3 değerini formülde yerine koyun: $$ b(3) = b(3-1) * (-3) $$ $$ b(3) = b(2) * (-3) $$ b(2) değerini bilmiyoruz. Bu nedenle, n = 2 değerini formülde yerine koyun: $$ b(2) = b(2-1) * (-3) $$ $$ b(2) = b(1) * (-3) $$ b(1) değerinin 15 olduğunu biliyoruz. Bu nedenle, formülde yerine koyalım: $$ b(2) = 15 * (-3) $$ $$ b(2) = -45 $$ b(2) değerini bildiğimize göre b(3) formülünde yerine koyalım: $$ b(3) = b(2) * (-3) $$ $$ b(3) = -45 * (-3) $$ $$ b(3) = 135 $$ Artık b(3) değerini bildiğimize göre bu değeri b(4) formülünde yerine koyabiliriz: $$ b(4) = b(3) * (-3) $$ $$ b(4) = 135 * (-3) $$ $$ b(4) = -405 $$ Bu nedenle, dizideki 4. terim -405'tir.

İstem

Yanıt

Önce resimdeki formülü ayrıştırın.

Ardından, formüle göre "Dizideki 4. terim nedir?" sorusunu yanıtlayın.

Sonucu genişletmek için tıklayın

$$ b(n) = b(n-1) * (-3) $$

$$ b(1) = 15 $$

Formülde n = 4 değerini kullanın:

$$ b(4) = b(4-1) * (-3) $$

$$ b(4) = b(3) * (-3) $$

b(3) değerini bilmiyoruz. Bu nedenle, n = 3 değerini formülde yerine koyun:

$$ b(3) = b(3-1) * (-3) $$

$$ b(3) = b(2) * (-3) $$

b(2) değerini bilmiyoruz. Bu nedenle, n = 2 değerini formülde yerine koyun:

$$ b(2) = b(2-1) * (-3) $$

$$ b(2) = b(1) * (-3) $$

b(1) değerinin 15 olduğunu biliyoruz. Bu nedenle, formülde yerine koyalım:

$$ b(2) = 15 * (-3) $$

$$ b(2) = -45 $$

b(2) değerini bildiğimize göre b(3) formülünde yerine koyalım:

$$ b(3) = b(2) * (-3) $$

$$ b(3) = -45 * (-3) $$

$$ b(3) = 135 $$

Artık b(3) değerini bildiğimize göre bu değeri b(4) formülünde yerine koyabiliriz:

$$ b(4) = b(3) * (-3) $$

$$ b(4) = 135 * (-3) $$

$$ b(4) = -405 $$

Bu nedenle, dizideki 4. terim -405'tir.

Bu model yanıtı doğru. Yanıtı daha da kolaylaştırmak için modelden adım adım düşünmesini isteyebilirsiniz.

Güncellenen istem	İyileştirilmiş yanıt
Dizideki 4. terim nedir? Adım adım düşünün.	İlk terim 15'tir. İkinci terim b(1) * (-3) = 15 * (-3) = -45 olur. Üçüncü terim b(2) * (-3) = -45 * (-3) = 135'tir. Dördüncü terim b(3) * (-3) = 135 * (-3) = -405'tir.

Güncellenen istem

İyileştirilmiş yanıt

Dizideki 4. terim nedir? Adım adım düşünün.

İlk terim 15'tir.

İkinci terim b(1) * (-3) = 15 * (-3) = -45 olur.

Üçüncü terim b(2) * (-3) = -45 * (-3) = 135'tir.

Dördüncü terim b(3) * (-3) = 135 * (-3) = -405'tir.

Çıkış biçimini belirtme

Sık karşılaşılan bir sorun, özellikle model çıkışının aşağı akış görevinde kullanılması gerekiyorsa model çıkışının belirli bir biçimde (ör. Markdown, JSON, HTML) olması gerektiğidir. İstemde modeli bu biçimde çıkış üretmeye yönlendirerek bu biçimde çıkış üretmeyi deneyebilirsiniz. Aşağıda iki örnek verilmiştir:

İstem	Model yanıtı
Bu resimdeki tabloyu Markdown biçiminde ayrıştır	\| Konu \| Durum \| Saat \| Başlangıç tarihi \| Son tarih \| \| ------- \| ------ \| ---- \| ---------- \| ------ \| \| Matematik \| Tamamlandı \| 1,5 saat \| 29.11.2023 \| 01.12.2023 \| \| Coğrafya \| Tamamlandı \| 30 dakika \| 2.12.2023 \| 4.12.2023 \| \| Fizik \| Devam ediyor \| 2 saat \| 3.12.2023 \| 5.12.2023 \| \| Biyoloji \| Başlatılmadı \| 6 saat \| 02.11.2016 \| 06.12.2023 \|

İstem

Model yanıtı

Bu resimdeki tabloyu Markdown biçiminde ayrıştır

| ------- | ------ | ---- | ---------- | ------ |

İstem Model yanıtı

İstem	Model yanıtı
Aşağıdaki tüm özelliklerin listesini sağlayın: malzemeler, mutfak türü, vejetaryen olup olmadığı (JSON biçiminde)	```json `{` `"ingredients": [` `"rice",` `"shrimp",` `"clams",` `"mussels",` `"peas",` `"tomatoes",` `"onions",` `"garlic",` `"olive oil",` `"paprika",` `"salt",` `"pepper"` `],` `"type of cuisine": "Spanish",` `"vegetarian": false` `}` ```

Aşağıdaki tüm özelliklerin listesini sağlayın:

malzemeler, mutfak türü, vejetaryen olup olmadığı (JSON biçiminde)

```json

{

"ingredients": [

"rice",

"shrimp",

"clams",

"mussels",

"peas",

"tomatoes",

"onions",

"garlic",

"olive oil",

"paprika",

"salt",

"pepper"

],

"type of cuisine": "Spanish",

"vegetarian": false

}

```

Tek resim içeren istemlerde resminizi ön plana çıkarın

Gemini, istemdeki görüntü ve metni herhangi bir sırada yorumlayabilir ancak metin isteminden önce tek bir görüntü yerleştirmek daha iyi sonuçlar verebilir. Aşağıdaki örneklerde, her istemde metinden önce resmin geldiğini göreceksiniz.

Çok formatlı isteminizle ilgili sorunları giderme

Faydalı bir yanıt alamıyorsanız isteminizle ilgili sorunları gidermeniz gerekebilir. Deneyebileceğiniz birkaç strateji:

Model, resmin ilgili bölümünden bilgi almıyorsa

Daha ayrıntılı bir yanıt almak için istemin, yanıtını oluştururken hangi resim öğelerinden bilgi almasını istediğinizi belirtebilirsiniz.

İstem	Model yanıtı
Bu bezler bir bebeğe kaç gün yeter?	Bezler bitmeden 198 gün boyunca kullanılabilir.

Güncellenen istem	İyileştirilmiş yanıt
Bu bezler bitmeden ne kadar süre dayanır? Çocuğun yaşını belirlemek için kutunun üzerinde gösterilen ağırlığı ve kutudaki toplam bebek bezi sayısını kullanın. Toplam sayıyı, çocuğun günde kullandığı bez sayısına bölün.	Kutuda 198 adet bez bulunur. Kutuda, bezlerin 10-17 kg ağırlığındaki çocuklar için olduğu belirtiliyor. Bu ağırlık aralığındaki ortalama bir çocuk muhtemelen 1-2 yaşlarındadır. 2 yaşındaki bir çocuk genellikle günde 6 bez kullanır. Bu nedenle, bezler yaklaşık 33 gün (198/6) dayanır.

Güncellenen istem

İyileştirilmiş yanıt

Bu bezler bitmeden ne kadar süre dayanır?

Çocuğun yaşını belirlemek için kutunun üzerinde gösterilen ağırlığı ve kutudaki toplam bebek bezi sayısını kullanın.

Toplam sayıyı, çocuğun günde kullandığı bez sayısına bölün.

Kutuda 198 adet bez bulunur. Kutuda, bezlerin 10-17 kg ağırlığındaki çocuklar için olduğu belirtiliyor.

Bu ağırlık aralığındaki ortalama bir çocuk muhtemelen 1-2 yaşlarındadır.

2 yaşındaki bir çocuk genellikle günde 6 bez kullanır. Bu nedenle, bezler yaklaşık 33 gün (198/6) dayanır.

Model çıkışı çok genel ve resim girişine yeterince uyarlanmamışsa

Modelin yanıtını resimlere göre uyarlamasına yardımcı olmak için akıl yürütme görevini gerçekleştirmeden önce resimleri açıklamasını isteyin.

İstem	Model yanıtı
Bu resimlerin ortak noktası nedir?	Dört resmin tamamı manzara fotoğrafı örneğidir.

Güncellenen istem	İyileştirilmiş yanıt
Öncelikle her resimde ne olduğunu ayrıntılı olarak açıklayın. Bu resimlerin ortak noktası nedir?	İlk resimde bir kişinin bavul hazırladığı gösteriliyor. İkinci resimde, bir alışveriş merkezindeki boş koridor gösteriliyor. Üçüncü resimde bir rulo tuvalet kağıdı gösteriliyor. Dördüncü resimde karanlık ve fırtınalı bir deniz gösteriliyor. Bu resimlerin ortak özelliği, hepsinin geçiş alanlarına örnek olmasıdır. Geçiş alanları, iki yer veya durum arasında kalan yerler ya da durumlardır. Genellikle belirsizlik veya muğlaklık hissiyle karakterize edilirler. İlk resimde, kişinin evde ve seyahatte olma durumu arasında kaldığı gösteriliyor. İkinci resimde, iki mağaza arasındaki koridor gösteriliyor. Üçüncü resimde, tuvaleti temsil edebilecek tuvalet kağıdı gösteriliyor. Banyo, özel ve kamusal alanlar arasında geçiş yapılan bir yerdir. Dış dünyaya girmeye veya dış dünyadan ayrılmaya hazırlandığımız bir yerdir. Dördüncü resimde, sakin ve fırtınalı deniz arasında bir geçiş gösteriliyor. Geçiş alanları hem heyecan verici hem de rahatsız edici olabilir. Yeni başlangıçların veya sonların yeri olabilirler. Bunlar, düşünme veya harekete geçme yeri olabilir.

Güncellenen istem

İyileştirilmiş yanıt

Öncelikle her resimde ne olduğunu ayrıntılı olarak açıklayın. Bu resimlerin ortak noktası nedir?

İlk resimde bir kişinin bavul hazırladığı gösteriliyor. İkinci resimde, bir alışveriş merkezindeki boş koridor gösteriliyor. Üçüncü resimde bir rulo tuvalet kağıdı gösteriliyor. Dördüncü resimde karanlık ve fırtınalı bir deniz gösteriliyor.

Bu resimlerin ortak özelliği, hepsinin geçiş alanlarına örnek olmasıdır. Geçiş alanları, iki yer veya durum arasında kalan yerler ya da durumlardır. Genellikle belirsizlik veya muğlaklık hissiyle karakterize edilirler.

İlk resimde, kişinin evde ve seyahatte olma durumu arasında kaldığı gösteriliyor. İkinci resimde, iki mağaza arasındaki koridor gösteriliyor. Üçüncü resimde, tuvaleti temsil edebilecek tuvalet kağıdı gösteriliyor. Banyo, özel ve kamusal alanlar arasında geçiş yapılan bir yerdir. Dış dünyaya girmeye veya dış dünyadan ayrılmaya hazırlandığımız bir yerdir.

Dördüncü resimde, sakin ve fırtınalı deniz arasında bir geçiş gösteriliyor.

Geçiş alanları hem heyecan verici hem de rahatsız edici olabilir. Yeni başlangıçların veya sonların yeri olabilirler. Bunlar, düşünme veya harekete geçme yeri olabilir.

Ayrıca modelden, resimdeki içeriğe açıkça atıfta bulunmasını da isteyebilirsiniz.

Güncellenen istem	İyileştirilmiş yanıt
Bu resimlerin ortak noktası nedir? Yanıtınızda resimlerdeki içeriklere atıfta bulunun.	Tüm resimler seyahatle ilgili olmalıdır. İlk resimde bavul hazırlayan bir kişi, ikinci resimde bir alışveriş merkezindeki boş koridor, üçüncü resimde bir rulo tuvalet kağıdı, dördüncü resimde ise karanlık ve fırtınalı bir deniz gösteriliyor. Bu resimlerin hepsi seyahatle ilgili çünkü seyahat edenlerin ihtiyaç duyduğu veya kullandığı şeyler. İlk resimde, bir valizi paketleyen bir kişi gösteriliyor. Bu, insanların seyahate çıkarken yaptığı bir şeydir. İkinci resimde, insanların seyahatleri için eşya satın almak üzere sık sık gittiği bir yer olan alışveriş merkezindeki boş bir koridor gösteriliyor. Üçüncü resimde, insanların seyahat ederken sıkça kullandığı bir ürün olan tuvalet kağıdı rulosu gösteriliyor. Dördüncü resimde, insanların seyahat ederken sıklıkla karşılaştığı bir durum olan karanlık ve fırtınalı bir deniz gösteriliyor.

Güncellenen istem

İyileştirilmiş yanıt

Bu resimlerin ortak noktası nedir? Yanıtınızda resimlerdeki içeriklere atıfta bulunun.

Tüm resimler seyahatle ilgili olmalıdır. İlk resimde bavul hazırlayan bir kişi, ikinci resimde bir alışveriş merkezindeki boş koridor, üçüncü resimde bir rulo tuvalet kağıdı, dördüncü resimde ise karanlık ve fırtınalı bir deniz gösteriliyor.

Bu resimlerin hepsi seyahatle ilgili çünkü seyahat edenlerin ihtiyaç duyduğu veya kullandığı şeyler. İlk resimde, bir valizi paketleyen bir kişi gösteriliyor. Bu, insanların seyahate çıkarken yaptığı bir şeydir. İkinci resimde, insanların seyahatleri için eşya satın almak üzere sık sık gittiği bir yer olan alışveriş merkezindeki boş bir koridor gösteriliyor. Üçüncü resimde, insanların seyahat ederken sıkça kullandığı bir ürün olan tuvalet kağıdı rulosu gösteriliyor. Dördüncü resimde, insanların seyahat ederken sıklıkla karşılaştığı bir durum olan karanlık ve fırtınalı bir deniz gösteriliyor.

Aynı ipuçları, resimlerden elde edilen reklam öğesi çıktısı için de geçerlidir. Tavşanın yer aldığı aşağıdaki örnekte, modelden resimdeki unsurları dahil etmesini açıkça istemek çıkışı iyileştirebilir.

İstem	Model yanıtı
Bu resim hakkında bir şiir yazabilir misin?	Küçük tavşan, yumuşak ve kahverengi, Tarlada zıplıyor, yukarı ve aşağı. Kulakların uzun, kuyruğun küçük, En sevimli yaratık sensin. Yeşil ve tatlı çimleri yersin, Beni görünce de kaçarsın. Ama her zaman arkadaşın olacağım, Küçük tavşan, sonuna kadar.

İstem

Model yanıtı

Bu resim hakkında bir şiir yazabilir misin?

Küçük tavşan, yumuşak ve kahverengi,
Tarlada zıplıyor, yukarı ve aşağı.
Kulakların uzun, kuyruğun küçük,
En sevimli yaratık sensin.

Yeşil ve tatlı çimleri yersin,
Beni görünce de kaçarsın.
Ama her zaman arkadaşın olacağım,
Küçük tavşan, sonuna kadar.

Güncellenen istem	İyileştirilmiş yanıt
Bu resim hakkında açıklayıcı ve dramatik bir şiir yazabilir misin? Konumu da ekle.	Çayırda küçük bir tavşan, Kulakları çok uzun, çok keskin. Ne görüyorsun orada, Uzakta, baktığın yerde? Is it the ocean blue, Sparkling in the sun's hue? Ya da dalgaların çarpıp kükremesi, Bayıldığın bir ritim? Küçük tavşan, doğruyu söyle bana, İlginizi bu kadar çok çeken şey ne? Tuzlu esinti mi, Yoksa martıların çığlıkları mı hoşunuza gidiyor? Belki de her şeyin büyüklüğüdür, Dünya hem çok büyük hem de çok küçük. Hayallerin dolaşabileceği, Maceraların ekilebileceği bir yer. Küçük tavşan, ne hayal ettiğini merak ediyorum, Çimlerin üzerinde otururken, çok sakin. Derinlikleri keşfetmek mi istersin, Yoksa karada kalıp zıplamak mı? Küçük tavşan, ne olursa olsun merak kıvılcımını parlak bir şekilde yakmaya devam et. Çünkü hayallerinizde ve arzularınızda, Yaratılmayı bekleyen bir dünya var.

Güncellenen istem

İyileştirilmiş yanıt

Bu resim hakkında açıklayıcı ve dramatik bir şiir yazabilir misin? Konumu da ekle.

Çayırda küçük bir tavşan,
Kulakları çok uzun, çok keskin.
Ne görüyorsun orada,
Uzakta, baktığın yerde?

Is it the ocean blue,
Sparkling in the sun's hue?
Ya da dalgaların çarpıp kükremesi,
Bayıldığın bir ritim?

Küçük tavşan, doğruyu söyle bana,
İlginizi bu kadar çok çeken şey ne?
Tuzlu esinti mi,
Yoksa martıların çığlıkları mı hoşunuza gidiyor?

Belki de her şeyin büyüklüğüdür,
Dünya hem çok büyük hem de çok küçük.
Hayallerin dolaşabileceği,
Maceraların ekilebileceği bir yer.

Küçük tavşan, ne hayal ettiğini merak ediyorum,
Çimlerin üzerinde otururken, çok sakin.
Derinlikleri keşfetmek mi istersin,
Yoksa karada kalıp zıplamak mı?

Küçük tavşan, ne olursa olsun
merak kıvılcımını parlak bir şekilde yakmaya devam et.
Çünkü hayallerinizde ve arzularınızda,
Yaratılmayı bekleyen bir dünya var.

İstemin hangi bölümünün başarısız olduğunu belirleme

Bir istemin başarısız olmasının nedeni, modelin görüntüyü anlamaması mı yoksa görüntüyü anlamasına rağmen doğru akıl yürütme adımlarını uygulamaması mı, bunu anlamak zor olabilir. Bu nedenleri netleştirmek için modelden resimde ne olduğunu açıklamasını isteyin.

Aşağıdaki örnekte, model çayla birlikte şaşırtıcı görünen bir atıştırmalıkla (ör. patlamış mısır) yanıt verirse önce modelin resimde çay olduğunu doğru tanıyıp tanımadığını belirlemek için sorun giderme işlemi yapabilirsiniz.

İstem	Sorun giderme istemi
Bununla iyi gidecek, 1 dakikada hazırlayabileceğim bir atıştırmalık önerir misin?	Bu resimde ne olduğunu açıklayın.

Diğer bir strateji ise modelden gerekçesini açıklamasını istemektir. Bu, muhakemenin hangi kısmında sorun olduğunu (varsa) belirlemenize yardımcı olabilir.

İstem	Sorun giderme istemi
Bununla iyi gidecek, 1 dakikada hazırlayabileceğim bir atıştırmalık önerir misin?	Bununla iyi gidecek, 1 dakikada hazırlayabileceğim bir atıştırmalık önerir misin? Lütfen nedeniyle birlikte açıklayın.

Sırada ne var?

Google AI Studio'yu kullanarak kendi çok formatlı istemlerinizi yazmayı deneyin.
Medya dosyalarını yüklemek ve istemlerinize dahil etmek için Gemini Files API'yi kullanma hakkında bilgi edinmek üzere Vision, Ses ve Belge işleme kılavuzlarına bakın.
İstem tasarımıyla ilgili daha fazla bilgi (ör. örnekleme parametrelerini ayarlama) için İstem stratejileri sayfasına bakın.

Dosyalar API'si

Dosya yükleyin

Python

JavaScript

Go

REST

Dosyanın meta verilerini alma

Python

JavaScript

Go

REST

Yüklenen dosyaları listeleme

Python

JavaScript

Go

REST

Yüklenen dosyaları silme

Python

JavaScript

Go

REST

Kullanım bilgileri

Dosya istemi stratejileri

İstem tasarımıyla ilgili temel bilgiler

Çok formatlı isteminizle ilgili sorunları giderme

Talimatlarınızda net olun

Birkaç örnek ekleyin

Adım adım açıklama

Çıkış biçimini belirtme

Tek resim içeren istemlerde resminizi ön plana çıkarın

Çok formatlı isteminizle ilgili sorunları giderme

Model, resmin ilgili bölümünden bilgi almıyorsa

Model çıkışı çok genel ve resim girişine yeterince uyarlanmamışsa

İstemin hangi bölümünün başarısız olduğunu belirleme

Sırada ne var?