Halaman ini diterjemahkan oleh Cloud Translation API.

Pembuatan gambar

Anda dapat membuat gambar menggunakan Gemini API dengan kemampuan multimodal bawaan Gemini atau Imagen, model pembuatan gambar khusus Google. Untuk sebagian besar kasus penggunaan, mulailah dengan Gemini. Pilih Imagen untuk tugas khusus yang memerlukan kualitas gambar yang sangat baik. Lihat bagian Memilih model yang tepat untuk panduan selengkapnya.

Semua gambar yang dihasilkan menyertakan watermark SynthID.

Sebelum memulai

Pastikan Anda menggunakan model dan versi yang didukung untuk pembuatan gambar:

Untuk Gemini, gunakan Pembuatan Gambar Pratinjau Flash Gemini 2.0.
Untuk Imagen, gunakan Imagen 3. Perhatikan bahwa model ini hanya tersedia di Paket berbayar.

Anda dapat mengakses Gemini dan Imagen 3 menggunakan library yang sama.

Membuat gambar menggunakan Gemini

Gemini dapat membuat dan memproses gambar secara percakapan. Anda dapat meminta Gemini dengan teks, gambar, atau kombinasi keduanya untuk menyelesaikan berbagai tugas terkait gambar, seperti pembuatan dan pengeditan gambar.

Anda harus menyertakan responseModalities: ["TEXT", "IMAGE"] dalam konfigurasi. Output khusus gambar tidak didukung dengan model ini.

Pembuatan gambar (teks ke gambar)

Kode berikut menunjukkan cara membuat gambar berdasarkan perintah deskriptif:

PythonJavaScriptGoREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateContentConfig{
      ResponseModalities: []string{"TEXT", "IMAGE"},
  }

  result, _ := client.Models.GenerateContent(
      ctx,
      "gemini-2.0-flash-preview-image-generation",
      genai.Text("Hi, can you create a 3d rendered image of a pig " +
                 "with wings and a top hat flying over a happy " +
                 "futuristic scifi city with lots of greenery?"),
      config,
  )

  for _, part := range result.Candidates[0].Content.Parts {
      if part.Text != "" {
          fmt.Println(part.Text)
      } else if part.InlineData != nil {
          imageBytes := part.InlineData.Data
          outputFilename := "gemini_generated_image.png"
          _ = os.WriteFile(outputFilename, imageBytes, 0644)
      }
  }
}

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png

Gambar babi terbang fantastis yang dibuat AI

Pengeditan gambar (teks dan gambar ke gambar)

Untuk melakukan pengeditan gambar, tambahkan gambar sebagai input. Contoh berikut menunjukkan cara mengupload gambar yang dienkode base64. Untuk beberapa gambar dan payload yang lebih besar, lihat bagian input gambar.

PythonJavaScriptGoREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

package main

import (
 "context"
 "fmt"
 "os"
 "google.golang.org/genai"
)

func main() {

 ctx := context.Background()
 client, _ := genai.NewClient(ctx, &genai.ClientConfig{
     APIKey:  os.Getenv("GEMINI_API_KEY"),
     Backend: genai.BackendGeminiAPI,
 })

 imagePath := "/path/to/image.png"
 imgData, _ := os.ReadFile(imagePath)

 parts := []*genai.Part{
   genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
   &genai.Part{
     InlineData: &genai.Blob{
       MIMEType: "image/png",
       Data:     imgData,
     },
   },
 }

 contents := []*genai.Content{
   genai.NewContentFromParts(parts, genai.RoleUser),
 }

 config := &genai.GenerateContentConfig{
     ResponseModalities: []string{"TEXT", "IMAGE"},
 }

 result, _ := client.Models.GenerateContent(
     ctx,
     "gemini-2.0-flash-preview-image-generation",
     contents,
     config,
 )

 for _, part := range result.Candidates[0].Content.Parts {
     if part.Text != "" {
         fmt.Println(part.Text)
     } else if part.InlineData != nil {
         imageBytes := part.InlineData.Data
         outputFilename := "gemini_generated_image.png"
         _ = os.WriteFile(outputFilename, imageBytes, 0644)
     }
 }
}

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Mode pembuatan gambar lainnya

Gemini mendukung mode interaksi gambar lainnya berdasarkan struktur perintah dan konteks, termasuk:

Teks ke gambar dan teks (disisipkan): Menghasilkan gambar dengan teks terkait.
- Contoh perintah: "Buat resep bergambar untuk paella".
Gambar dan teks ke gambar dan teks (disisipkan): Menggunakan gambar dan teks input untuk membuat gambar dan teks terkait baru.
- Contoh perintah: (Dengan gambar ruangan yang dilengkapi furnitur) "Sofa warna apa yang cocok untuk ruangan saya? Bisakah Anda memperbarui gambarnya?"
Pengeditan gambar multi-giliran (chat): Terus buat / edit gambar secara percakapan.
- Contoh perintah: [upload gambar mobil biru.] , "Ubah mobil ini menjadi mobil konversi", "Sekarang ubah warnanya menjadi kuning."

Batasan

Untuk performa terbaik, gunakan bahasa berikut: EN, es-MX, ja-JP, zh-CN, hi-IN.
Pembuatan gambar tidak mendukung input audio atau video.
Pembuatan gambar mungkin tidak selalu memicu:
- Model hanya dapat menghasilkan teks. Coba minta output gambar secara eksplisit (misalnya, "buat gambar", "berikan gambar saat Anda melakukannya", "update gambar").
- Model mungkin berhenti menghasilkan di tengah jalan. Coba lagi atau coba perintah lain.
Saat membuat teks untuk gambar, Gemini akan berfungsi optimal jika Anda membuat teks terlebih dahulu, lalu meminta gambar dengan teks tersebut.
Ada beberapa wilayah/negara tempat Pembuatan gambar tidak tersedia. Lihat Model untuk mengetahui informasi selengkapnya.

Membuat gambar menggunakan Imagen 3

Contoh ini menunjukkan pembuatan gambar dengan Imagen 3:

PythonJavaScriptGoREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-3.0-generate-002",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

Gambar robot yang dibuat AI yang memegang skateboard merah

Parameter model Imagen

Saat ini, Imagen hanya mendukung perintah dalam bahasa Inggris dan parameter berikut:

numberOfImages: Jumlah gambar yang akan dihasilkan, dari 1 hingga 4 (inklusif). Defaultnya adalah 4.
aspectRatio: Mengubah rasio aspek gambar yang dihasilkan. Nilai yang didukung adalah "1:1", "3:4", "4:3", "9:16", dan "16:9". Defaultnya adalah "1:1".
personGeneration: Mengizinkan model membuat gambar orang. Nilai berikut didukung:
- "dont_allow": Memblokir pembuatan gambar orang.
- "allow_adult": Membuat gambar orang dewasa, tetapi tidak untuk anak-anak. Ini adalah defaultnya.
- "allow_all": Buat gambar yang menyertakan orang dewasa dan anak-anak.
Catatan: Nilai parameter "allow_all" tidak diizinkan di lokasi Uni Eropa, Inggris Raya, Swiss, dan MENA.

Memilih model yang tepat

Pilih Gemini jika:

Anda memerlukan gambar yang relevan secara kontekstual yang memanfaatkan pengetahuan dan penalaran dunia.
Menggabungkan teks dan gambar dengan lancar sangatlah penting.
Anda ingin visual yang akurat disematkan dalam urutan teks yang panjang.
Anda ingin mengedit gambar secara percakapan sambil mempertahankan konteks.

Pilih Imagen 3 jika:

Kualitas gambar, fotorealisme, detail artistik, atau gaya tertentu (misalnya, impresionisme, anime) adalah prioritas utama.
Melakukan tugas pengeditan khusus seperti pembaruan latar belakang produk atau peningkatan dimensi gambar.
Menerapkan branding, gaya, atau membuat logo dan desain produk.

Panduan perintah Imagen

Bagian panduan Imagen ini menunjukkan cara memodifikasi perintah teks ke gambar dapat menghasilkan hasil yang berbeda, beserta contoh gambar yang dapat Anda buat.

Dasar-dasar penulisan perintah

Perintah yang baik bersifat deskriptif dan jelas, serta menggunakan kata kunci dan pengubah yang bermakna. Mulailah dengan memikirkan subjek, konteks, dan gaya Anda.

Perintah dengan subjek, konteks, dan gaya yang ditekankan — Teks gambar: *Sketsa* (**gaya**) dari *gedung apartemen modern* (**subjek**) dikelilingi *pilar* (**konteks dan latar belakang**).

Subjek: Hal pertama yang harus dipikirkan dengan perintah apa pun adalah subjek: objek, orang, hewan, atau pemandangan yang Anda inginkan gambarnya.
Konteks dan latar belakang: Sama pentingnya adalah latar belakang atau konteks tempat subjek akan ditempatkan. Coba tempatkan subjek di berbagai latar belakang. Misalnya, studio dengan latar belakang putih, di luar ruangan, atau di dalam ruangan.
Gaya: Terakhir, tambahkan gaya gambar yang Anda inginkan. Gaya dapat bersifat umum (lukisan, foto, sketsa) atau yang sangat spesifik (lukisan pastel, gambar arang, 3D isometrik). Anda juga dapat menggabungkan gaya.

Setelah menulis versi pertama perintah, pertajam perintah dengan menambahkan detail lainnya hingga Anda mendapatkan gambar yang diinginkan. Iterasi adalah hal penting. Mulailah dengan menetapkan ide inti, lalu pertajam dan perluas ide inti tersebut hingga gambar yang dihasilkan mendekati visi Anda.

contoh gambar fotorealistik 1 — Perintah: Taman di musim semi di samping danau

gambar contoh fotorealistik 2 — Perintah: Taman di musim semi di samping danau, **matahari terbenam di seberang danau, golden hour**

gambar contoh fotorealistik 3 — Perintah: Taman di musim semi di samping danau, **matahari terbenam di seberang danau, golden hour, bunga liar merah**

Imagen 3 dapat mengubah ide Anda menjadi gambar mendetail, baik perintah Anda singkat maupun panjang dan mendetail. Tingkatkan visi Anda melalui perintah berulang, tambahkan detail hingga Anda mencapai hasil yang sempurna.

Perintah singkat memungkinkan Anda membuat gambar dengan cepat.

Contoh perintah singkat Imagen 3 — Perintah: foto close-up seorang wanita berusia 20-an, fotografi jalanan, still film, nuansa hangat oranye yang redup

Perintah yang lebih panjang memungkinkan Anda menambahkan detail spesifik dan membuat gambar.

Contoh perintah panjang Imagen 3 — Perintah: foto menarik seorang wanita berusia 20-an yang menggunakan gaya fotografi jalanan. Gambar akan terlihat seperti gambar diam film dengan nuansa hangat oranye yang redup.

Saran tambahan untuk menulis perintah Imagen:

Gunakan bahasa deskriptif: Gunakan kata sifat dan kata keterangan yang mendetail untuk memberikan gambaran yang jelas untuk Imagen 3.
Berikan konteks: Jika perlu, sertakan informasi latar belakang untuk membantu pemahaman AI.
Mereferensikan artis atau gaya tertentu: Jika Anda memiliki estetika tertentu yang diinginkan, mereferensikan artis atau gerakan seni tertentu dapat membantu.
Gunakan alat prompt engineering: Pertimbangkan untuk mempelajari alat atau referensi prompt engineering untuk membantu Anda meningkatkan kualitas perintah dan mencapai hasil yang optimal.
Meningkatkan detail wajah dalam gambar pribadi dan grup Anda: Tentukan detail wajah sebagai fokus foto (misalnya, gunakan kata "potret" dalam perintah).

Membuat teks dalam gambar

Imagen dapat menambahkan teks ke dalam gambar, sehingga membuka lebih banyak kemungkinan pembuatan gambar yang kreatif. Gunakan panduan berikut untuk mendapatkan hasil maksimal dari fitur ini:

Lakukan iterasi dengan percaya diri: Anda mungkin harus membuat ulang gambar hingga mencapai tampilan yang diinginkan. Integrasi teks Imagen masih berkembang, dan terkadang beberapa upaya menghasilkan hasil terbaik.
Panjangnya singkat: Batasi teks hingga 25 karakter atau kurang untuk pembuatan yang optimal.
Beberapa frasa: Bereksperimenlah dengan dua atau tiga frasa yang berbeda untuk memberikan informasi tambahan. Hindari melebihi tiga frasa untuk komposisi yang lebih bersih.

Perintah: Poster dengan teks "Summerland" dalam font tebal sebagai judul, di bawah teks ini terdapat slogan "Summer never felt so good"
Panduan Penempatan: Meskipun Imagen dapat mencoba memosisikan teks sesuai petunjuk, terkadang akan ada variasi. Fitur ini terus ditingkatkan.
Gaya font inspirasi: Tentukan gaya font umum untuk memengaruhi pilihan Imagen secara halus. Jangan mengandalkan replikasi font yang akurat, tetapi harapkan interpretasi materi iklan.
Ukuran font: Tentukan ukuran font atau indikasi ukuran umum (misalnya, kecil, sedang, besar) untuk memengaruhi pembuatan ukuran font.

Parameterisasi perintah

Untuk mengontrol hasil output dengan lebih baik, Anda mungkin perlu memparametrisasi input ke dalam Imagen. Misalnya, Anda ingin pelanggan dapat membuat logo untuk bisnis mereka, dan Anda ingin memastikan logo selalu dibuat dengan latar belakang warna solid. Anda juga ingin membatasi opsi yang dapat dipilih klien dari menu.

Dalam contoh ini, Anda dapat membuat perintah berparameter yang mirip dengan berikut:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Di antarmuka pengguna kustom Anda, pelanggan dapat memasukkan parameter menggunakan menu, dan nilai yang dipilih akan mengisi perintah yang diterima Imagen.

Contoh:

Perintah: A minimalist logo for a health care company on a solid color background. Include the text Journey.
Perintah: A modern logo for a software company on a solid color background. Include the text Silo.
Perintah: A traditional logo for a baking company on a solid color background. Include the text Seed.

Teknik penulisan perintah lanjutan

Gunakan contoh berikut untuk membuat perintah yang lebih spesifik berdasarkan atribut seperti deskripsi fotografi, bentuk dan bahan, gerakan seni historis, dan pengubah kualitas gambar.

Fotografi

Perintah menyertakan: "Foto..."

Untuk menggunakan gaya ini, mulai dengan menggunakan kata kunci yang dengan jelas memberi tahu Imagen bahwa Anda mencari foto. Mulailah perintah Anda dengan "Foto. . .". Misalnya:

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.}

Pengubah fotografi

Pada contoh berikut, Anda dapat melihat beberapa pengubah dan parameter khusus fotografi. Anda dapat menggabungkan beberapa pengubah untuk kontrol yang lebih akurat.

Kedekatan Kamera - Jarak dekat, diambil dari jarak jauh

gambar contoh kamera jarak dekat — Perintah: Foto biji kopi **dari jarak dekat**

gambar contoh kamera yang diperkecil — Perintah: Foto **diperkecil** sekantong kecil
biji kopi di dapur yang berantakan

Posisi Kamera - dari atas, dari bawah

Perintah: foto udara kota perkotaan dengan gedung pencakar langit

Perintah: Foto kanopi hutan dengan langit biru dari bawah

Pencahayaan - alami, dramatis, hangat, dingin

gambar contoh pencahayaan alami — Perintah: foto studio kursi berlengan modern, **cahaya alami**

gambar contoh pencahayaan dramatis — Perintah: foto studio kursi berlengan modern, **cahaya dramatis**

Setelan Kamera - motion blur, soft focus, bokeh, potret

gambar contoh motion blur — Perintah: foto kota dengan gedung pencakar langit dari dalam mobil dengan **motion blur**

gambar contoh soft focus — Perintah: Foto **soft focus** jembatan di kota perkotaan pada malam hari

Jenis lensa - 35 mm, 50 mm, mata ikan, sudut lebar, makro

Perintah: foto daun, lensa makro

Perintah: fotografi jalanan, kota New York, lensa mata ikan
Jenis film - hitam dan putih, polaroid

Perintah: potret polaroid yang memakai kacamata hitam

Perintah: foto hitam putih yang memakai kacamata hitam

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.}

Ilustrasi dan seni

Perintah menyertakan: "painting dari...", "sketch dari..."

Gaya seni bervariasi mulai dari gaya monokrom seperti sketsa pensil, hingga seni digital yang sangat realistis. Misalnya, gambar berikut menggunakan perintah yang sama dengan gaya yang berbeda:

"[art style or creation technique] sedan listrik sporty sudut dengan pencakar langit di latar belakang"

gambar contoh karya seni — Perintah: **Gambar dengan teknik pensil** dari sudut...

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 2.}

Bentuk dan bahan

Perintah mencakup: "...terbuat dari...", "...dalam bentuk..."

Salah satu keunggulan teknologi ini adalah Anda dapat membuat citra yang sulit atau tidak mungkin dilakukan. Misalnya, Anda dapat membuat ulang logo perusahaan dengan bahan dan tekstur yang berbeda.

contoh gambar bentuk dan bahan 1 — Perintah: tas wol **terbuat dari** keju

contoh gambar bentuk dan bahan 2 — Perintah: tabung neon **berbentuk** burung

contoh gambar 3 bentuk dan bahan 3 — Perintah: kursi berlengan **terbuat dari kertas**, foto studio, gaya origami

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.}

Referensi seni bersejarah

Perintah mencakup: "...dalam gaya..."

Gaya tertentu telah menjadi ikon selama bertahun-tahun. Berikut adalah beberapa ide lukisan sejarah atau gaya seni yang dapat Anda coba.

"buat gambar dengan gaya [art period or movement]: ladang kincir angin"

gambar contoh impresionisme — Perintah: buat gambar dengan gaya *lukisan impresionis*: ladang kincir angin

gambar contoh renaisans — Perintah: buat gambar dengan gaya *lukisan renaisans*: ladang kincir angin

gambar contoh seni pop — Perintah: buat gambar dengan gaya *seni pop*: ladang kincir angin

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.}

Pengubah kualitas gambar

Kata kunci tertentu dapat memberi tahu model bahwa Anda mencari aset berkualitas tinggi. Contoh pengubah kualitas mencakup hal berikut:

Pengubah Umum - berkualitas tinggi, indah, bergaya
Foto - 4K, HDR, Foto Studio
Seni, Ilustrasi - oleh profesional, mendetail

Berikut adalah beberapa contoh perintah tanpa pengubah kualitas dan perintah yang sama dengan pengubah kualitas.

gambar contoh jagung tanpa pengubah — Perintah (tanpa pengubah kualitas): foto batang jagung

gambar contoh jagung dengan pengubah — Perintah (dengan pengubah kualitas): **Foto 4k HDR yang indah**
dari sebuah foto batang jagung diambil oleh
fotografer profesional

^{Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.}

Rasio aspek

Pembuatan gambar Imagen 3 memungkinkan Anda menetapkan lima rasio aspek gambar yang berbeda.

Persegi (1:1, default) - Foto persegi standar. Penggunaan umum untuk rasio aspek ini mencakup postingan media sosial.

Layar penuh (4:3) - Rasio aspek ini biasanya digunakan dalam media atau film. Dimensi ini juga merupakan dimensi sebagian besar TV lama (non-layar lebar) dan kamera format sedang. Rasio ini menangkap lebih banyak pemandangan secara horizontal (dibandingkan dengan 1:1), sehingga menjadi rasio aspek yang lebih disukai untuk fotografi.

contoh rasio aspek — Perintah: close up jari-jari musisi yang memainkan piano, film hitam putih, vintage (rasio aspek 4:3)

Layar penuh potret (3:4) - Ini adalah rasio aspek layar penuh yang diputar 90 derajat. Hal ini memungkinkan pengambilan lebih banyak scene secara vertikal dibandingkan dengan rasio aspek 1:1.

Layar lebar (16:9) - Rasio ini telah menggantikan 4:3 dan kini menjadi rasio aspek yang paling umum untuk TV, monitor, dan layar ponsel (lanskap). Gunakan rasio aspek ini jika Anda ingin mengambil lebih banyak latar belakang (misalnya, lanskap yang indah).

Perintah: seorang pria mengenakan pakaian serba putih yang duduk di pantai, close up, pencahayaan golden hour (rasio aspek 16:9)
Potret (9:16) - Rasio ini adalah layar lebar, tetapi diputar. Ini adalah rasio aspek yang relatif baru yang telah dipopulerkan oleh aplikasi video pendek (misalnya, YouTube Shorts). Gunakan ini untuk objek tinggi dengan orientasi vertikal yang kuat seperti bangunan, pohon, air terjun, atau objek serupa lainnya.

Perintah: render digital dari gedung pencakar langit besar, modern, megah, epik dengan matahari terbenam yang indah di latar belakang (rasio aspek 9:16)

Gambar fotorealistik

Versi model pembuatan gambar yang berbeda mungkin menawarkan campuran output artistik dan fotorealistik. Gunakan kata-kata berikut dalam perintah untuk menghasilkan output yang lebih fotorealistik, berdasarkan subjek yang ingin Anda buat.

Kasus penggunaan	Jenis lensa	Panjang fokus	Detail tambahan
Orang (potret)	Tanda petik, zoom	24-35mm	film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna)
Makanan, serangga, tanaman (objek, benda mati)	Macro	60-105mm	Detail tinggi, fokus presisi, pencahayaan terkontrol
Olahraga, satwa liar (gerakan)	Zoom telefoto	100-400mm	Kecepatan shutter cepat, Pelacakan gerakan atau tindakan
Astronomi, lanskap (sudut lebar)	Sudut lebar	10-24mm	Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus

Potret

Kasus penggunaan	Jenis lensa	Panjang fokus	Detail tambahan
Orang (potret)	Tanda petik, zoom	24-35mm	film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna)

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan potret berikut:

Perintah: Wanita, potret 35 mm, duotone biru dan abu-abu
Model: imagen-3.0-generate-002

Perintah: Wanita, potret 35 mm, film noir
Model: imagen-3.0-generate-002

Objek

Kasus penggunaan	Jenis lensa	Panjang fokus	Detail tambahan
Makanan, serangga, tanaman (objek, benda mati)	Macro	60-105mm	Detail tinggi, fokus presisi, pencahayaan terkontrol

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar objek berikut:

Perintah: daun tanaman doa, lensa makro, 60 mm
Model: imagen-3.0-generate-002

Perintah: sepiring pasta, Lensa Makro 100 mm
Model: imagen-3.0-generate-002

Gerakan

Kasus penggunaan	Jenis lensa	Panjang fokus	Detail tambahan
Olahraga, satwa liar (gerakan)	Zoom telefoto	100-400mm	Kecepatan shutter cepat, Pelacakan gerakan atau tindakan

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar gerakan berikut:

Perintah: touchdown yang menentukan kemenangan, kecepatan shutter yang cepat, pelacakan gerakan
Model: imagen-3.0-generate-002

Perintah: Seekor rusa berlari di hutan, kecepatan shutter cepat, pelacakan gerakan
Model: imagen-3.0-generate-002

Sudut lebar

Kasus penggunaan	Jenis lensa	Panjang fokus	Detail tambahan
Astronomi, lanskap (sudut lebar)	Sudut lebar	10-24mm	Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan gambar sudut lebar berikut:

Perintah: pegunungan yang luas, sudut lebar lanskap 10 mm
Model: imagen-3.0-generate-002

Perintah: foto bulan, fotografi astro, sudut lebar 10 mm
Model: imagen-3.0-generate-002

Langkah berikutnya

Lihat panduan Veo untuk mempelajari cara membuat video dengan Gemini API.
Untuk mempelajari model Gemini 2.0 lebih lanjut, lihat Model Gemini dan Model eksperimental.