Buat gambar

Gemini API mendukung pembuatan gambar menggunakan Gemini 2.0 Flash Experimental dan menggunakan Imagen 3. Panduan ini membantu Anda memulai kedua model tersebut.

Untuk panduan perintah gambar, lihat bagian Panduan perintah Imagen.

Sebelum memulai

Sebelum memanggil Gemini API, pastikan Anda telah menginstal SDK pilihan, dan kunci Gemini API telah dikonfigurasi dan siap digunakan.

Membuat gambar menggunakan Gemini

Gemini 2.0 Flash Experimental mendukung kemampuan untuk menghasilkan output teks dan gambar inline. Hal ini memungkinkan Anda menggunakan Gemini untuk mengedit gambar secara percakapan atau membuat output dengan teks yang terjalin (misalnya, membuat postingan blog dengan teks dan gambar dalam satu giliran). Semua gambar yang dihasilkan menyertakan watermark SynthID, dan gambar di Google AI Studio juga menyertakan watermark yang terlihat.

Contoh berikut menunjukkan cara menggunakan Gemini 2.0 untuk menghasilkan output teks dan gambar:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

REST

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png
Gambar babi terbang fantastis yang dibuat AI
Gambar babi terbang fantastis yang dibuat AI

Bergantung pada perintah dan konteks, Gemini akan membuat konten dalam mode yang berbeda (teks ke gambar, teks ke gambar dan teks, dll.). Berikut beberapa contohnya:

  • Teks ke gambar
    • Contoh perintah: "Buat gambar menara Eiffel dengan kembang api di latar belakang."
  • Teks ke gambar dan teks (disisipkan)
    • Contoh perintah: "Buat resep bergambar untuk paella."
  • Gambar dan teks ke gambar dan teks (disisipkan)
    • Contoh perintah: (Dengan gambar ruangan yang dilengkapi furnitur) "Sofa warna apa lagi yang cocok untuk ruangan saya? Bisakah Anda memperbarui gambarnya?"
  • Pengeditan gambar (teks dan gambar ke gambar)
    • Contoh perintah: "Edit gambar ini agar terlihat seperti kartun"
    • Contoh perintah: [gambar kucing] + [gambar bantal] + "Buat sulaman silang kucing saya di bantal ini".
  • Pengeditan gambar multi-giliran (chat)
    • Contoh perintah: [upload gambar mobil biru.] "Ubah mobil ini menjadi mobil konversi." "Sekarang ubah warnanya menjadi kuning."

Pengeditan gambar dengan Gemini

Untuk melakukan pengeditan gambar, tambahkan gambar sebagai input. Contoh berikut menunjukkan cara mengupload gambar berenkode base64. Untuk beberapa gambar dan payload yang lebih besar, lihat bagian input gambar.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

REST

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Batasan

  • Untuk performa terbaik, gunakan bahasa berikut: EN, es-MX, ja-JP, zh-CN, hi-IN.
  • Pembuatan gambar tidak mendukung input audio atau video.
  • Pembuatan gambar mungkin tidak selalu memicu:
    • Model hanya dapat menghasilkan teks. Coba minta output gambar secara eksplisit (misalnya, "buat gambar", "berikan gambar saat Anda melakukannya", "perbarui gambar").
    • Model mungkin berhenti menghasilkan di tengah jalan. Coba lagi atau coba perintah lain.
  • Saat membuat teks untuk gambar, Gemini berfungsi paling baik jika Anda membuat teks terlebih dahulu, lalu meminta gambar dengan teks tersebut.

Pilih model

Model mana yang harus Anda gunakan untuk membuat gambar? Hal ini bergantung pada kasus penggunaan Anda.

Gemini 2.0 paling cocok untuk menghasilkan gambar yang relevan secara kontekstual, menggabungkan teks + gambar, menggabungkan pengetahuan dunia, dan bernalar tentang gambar. Anda dapat menggunakannya untuk membuat visual yang akurat dan relevan secara kontekstual yang disematkan dalam urutan teks yang panjang. Anda juga dapat mengedit gambar secara percakapan, menggunakan bahasa alam, sambil mempertahankan konteks selama percakapan.

Jika kualitas gambar adalah prioritas utama Anda, Imagen 3 adalah pilihan yang lebih baik. Imagen 3 unggul dalam fotorealisme, detail artistik, dan gaya artistik tertentu seperti impresionisme atau anime. Imagen 3 juga merupakan pilihan yang tepat untuk tugas pengeditan gambar khusus seperti memperbarui latar belakang produk, meningkatkan kualitas gambar, dan memasukkan branding dan gaya ke dalam visual. Anda dapat menggunakan Imagen 3 untuk membuat logo atau desain produk bermerek lainnya.

Membuat gambar menggunakan Imagen 3

Gemini API memberikan akses ke Imagen 3, model text-to-image berkualitas terbaik Google, yang menampilkan sejumlah kemampuan baru dan yang ditingkatkan. Imagen 3 dapat melakukan hal berikut:

  • Membuat gambar dengan detail yang lebih baik, pencahayaan yang lebih kaya, dan lebih sedikit artefak yang mengganggu dibandingkan model sebelumnya
  • Memahami perintah yang ditulis dalam bahasa alami
  • Buat gambar dalam berbagai format dan gaya
  • Merender teks secara lebih efektif daripada model sebelumnya

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Gambar dua kelinci kabur di dapur yang dibuat AI
Gambar dua kelinci lucu di dapur yang dibuat AI

Saat ini, Imagen hanya mendukung perintah dalam bahasa Inggris dan parameter berikut:

Parameter model Imagen

(Konvensi penamaan bervariasi menurut bahasa pemrograman.)

  • numberOfImages: Jumlah gambar yang akan dihasilkan, dari 1 hingga 4 (inklusif). Defaultnya adalah 4.
  • aspectRatio: Mengubah rasio aspek gambar yang dihasilkan. Nilai yang didukung adalah "1:1", "3:4", "4:3", "9:16", dan "16:9". Defaultnya adalah "1:1".
  • personGeneration: Mengizinkan model membuat gambar orang. Nilai berikut didukung:
    • "DONT_ALLOW": Memblokir pembuatan gambar orang.
    • "ALLOW_ADULT": Membuat gambar orang dewasa, tetapi tidak untuk anak-anak. Ini adalah defaultnya.

Panduan perintah Imagen

Bagian panduan Imagen ini menunjukkan cara memodifikasi perintah teks ke gambar dapat menghasilkan hasil yang berbeda, beserta contoh gambar yang dapat Anda buat.

Dasar-dasar penulisan perintah

Perintah yang baik bersifat deskriptif dan jelas, serta menggunakan kata kunci dan pengubah yang bermakna. Mulailah dengan memikirkan subjek, konteks, dan gaya Anda.

Perintah dengan subjek, konteks, dan gaya yang ditekankan
Teks gambar: Sketsa (gaya) dari gedung apartemen modern (subjek) dikelilingi pilar (konteks dan latar belakang).
  1. Subjek: Hal pertama yang harus dipikirkan dengan perintah apa pun adalah subjek: objek, orang, hewan, atau pemandangan yang Anda inginkan gambarnya.

  2. Konteks dan latar belakang: Sama pentingnya adalah latar belakang atau konteks tempat subjek akan ditempatkan. Coba tempatkan subjek di berbagai latar belakang. Misalnya, studio dengan latar belakang putih, di luar ruangan, atau di dalam ruangan.

  3. Gaya: Terakhir, tambahkan gaya gambar yang Anda inginkan. Gaya dapat bersifat umum (lukisan, foto, sketsa) atau yang sangat spesifik (lukisan pastel, gambar arang, 3D isometrik). Anda juga dapat menggabungkan gaya.

Setelah menulis versi pertama perintah, pertajam perintah dengan menambahkan detail lainnya hingga Anda mendapatkan gambar yang diinginkan. Iterasi adalah hal penting. Mulailah dengan menetapkan ide inti, lalu pertajam dan perluas ide inti tersebut hingga gambar yang dihasilkan mendekati visi Anda.

contoh gambar fotorealistik 1
Perintah: Taman di musim semi di samping danau
gambar contoh fotorealistik 2
Perintah: Taman di musim semi di samping danau, matahari terbenam di seberang danau, golden hour
gambar contoh fotorealistik 3
Perintah: Taman di musim semi di samping danau, matahari terbenam di seberang danau, golden hour, bunga liar merah

Imagen 3 dapat mengubah ide Anda menjadi gambar mendetail, baik perintah Anda singkat maupun panjang dan mendetail. Tingkatkan visi Anda melalui perintah berulang, tambahkan detail hingga Anda mencapai hasil yang sempurna.

Perintah singkat memungkinkan Anda membuat gambar dengan cepat.

Contoh perintah singkat Imagen 3
Perintah: foto close-up seorang wanita berusia 20-an, fotografi jalanan, still film, nuansa hangat oranye yang redup

Perintah yang lebih panjang memungkinkan Anda menambahkan detail spesifik dan membuat gambar.

Contoh perintah panjang Imagen 3
Perintah: foto menarik seorang wanita berusia 20-an yang menggunakan gaya fotografi jalanan. Gambar akan terlihat seperti gambar diam film dengan nuansa hangat oranye yang redup.

Saran tambahan untuk penulisan perintah Imagen:

  • Gunakan bahasa deskriptif: Gunakan kata sifat dan kata keterangan yang mendetail untuk memberikan gambaran yang jelas untuk Imagen 3.
  • Berikan konteks: Jika perlu, sertakan informasi latar belakang untuk membantu pemahaman AI.
  • Mereferensikan artis atau gaya tertentu: Jika Anda memiliki estetika tertentu dalam pikiran, mereferensikan artis atau gerakan seni tertentu dapat membantu.
  • Gunakan alat prompt engineering: Pertimbangkan untuk mempelajari alat atau referensi prompt engineering untuk membantu Anda meningkatkan kualitas perintah dan mencapai hasil yang optimal.
  • Meningkatkan detail wajah dalam gambar pribadi dan grup Anda:
    • Tentukan detail wajah sebagai fokus foto (misalnya, gunakan kata "potret" dalam perintah).

Membuat teks dalam gambar

Imagen dapat menambahkan teks ke dalam gambar, sehingga membuka lebih banyak kemungkinan pembuatan gambar yang kreatif. Gunakan panduan berikut untuk mendapatkan hasil maksimal dari fitur ini:

  • Lakukan iterasi dengan yakin: Anda mungkin harus membuat ulang gambar hingga mencapai tampilan yang diinginkan. Integrasi teks Imagen masih berkembang, dan terkadang beberapa upaya menghasilkan hasil terbaik.
  • Panjangnya singkat: Batasi teks hingga 25 karakter atau kurang untuk pembuatan yang optimal.
  • Beberapa frasa: Bereksperimenlah dengan dua atau tiga frasa yang berbeda untuk memberikan informasi tambahan. Hindari melebihi tiga frasa untuk komposisi yang lebih bersih.

    Contoh teks yang dihasilkan Imagen 3
    Perintah: Poster dengan teks "Summerland" dalam font tebal sebagai judul, di bawah teks ini terdapat slogan "Summer never felt so good"
  • Panduan Penempatan: Meskipun Imagen dapat mencoba memosisikan teks sesuai petunjuk, terkadang akan ada variasi. Fitur ini terus ditingkatkan.

  • Gaya font inspirasi: Tentukan gaya font umum untuk memengaruhi pilihan Imagen secara halus. Jangan mengandalkan replikasi font yang akurat, tetapi harapkan interpretasi materi iklan.

  • Ukuran font: Tentukan ukuran font atau indikasi ukuran umum (misalnya, kecil, sedang, besar) untuk memengaruhi pembuatan ukuran font.

Parameterisasi perintah

Untuk mengontrol hasil output dengan lebih baik, Anda mungkin perlu memparametrisasi input ke dalam Imagen. Misalnya, Anda ingin pelanggan dapat membuat logo untuk bisnis mereka, dan Anda ingin memastikan logo selalu dibuat dengan latar belakang warna solid. Anda juga ingin membatasi opsi yang dapat dipilih klien dari menu.

Dalam contoh ini, Anda dapat membuat perintah berparameter yang mirip dengan berikut:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Di antarmuka pengguna kustom Anda, pelanggan dapat memasukkan parameter menggunakan menu, dan nilai yang dipilih akan mengisi perintah yang diterima Imagen.

Contoh:

  1. Perintah: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Contoh 1 parameterisasi perintah Imagen 3

  2. Perintah: A modern logo for a software company on a solid color background. Include the text Silo.

    Contoh 2 parameterisasi perintah Imagen 3

  3. Perintah: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Contoh pemodelan perintah Imagen 3 3

Teknik penulisan perintah lanjutan

Gunakan contoh berikut untuk membuat perintah yang lebih spesifik berdasarkan atribut seperti deskripsi fotografi, bentuk dan bahan, gerakan seni historis, dan pengubah kualitas gambar.

Fotografi

  • Perintah menyertakan: "Foto..."

Untuk menggunakan gaya ini, mulai dengan menggunakan kata kunci yang dengan jelas memberi tahu Imagen bahwa Anda mencari foto. Mulailah perintah Anda dengan "Foto. . .". Misalnya:

contoh gambar fotorealistik 1
Perintah: Foto biji kopi di dapur pada permukaan kayu
gambar contoh fotorealistik 2
Perintah: Foto cokelat batangan di meja dapur
gambar contoh fotorealistik 3
Perintah: Foto bangunan modern dengan latar belakang air

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.

Pengubah fotografi

Pada contoh berikut, Anda dapat melihat beberapa pengubah dan parameter khusus fotografi. Anda dapat menggabungkan beberapa pengubah untuk kontrol yang lebih akurat.

  1. Kedekatan Kamera - Jarak dekat, diambil dari jarak jauh

    gambar contoh kamera jarak dekat
    Perintah: Foto biji kopi dari jarak dekat
    gambar contoh kamera yang diperkecil
    Perintah: Foto diperkecil sekantong kecil
    biji kopi di dapur yang berantakan

  2. Posisi Kamera - dari atas, dari bawah

    gambar contoh foto dari atas
    Perintah: foto udara kota perkotaan dengan gedung pencakar langit
    tampilan dari bawah gambar contoh
    Perintah: Foto kanopi hutan dengan langit biru dari bawah
  3. Pencahayaan - alami, dramatis, hangat, dingin

    gambar contoh pencahayaan alami
    Perintah: foto studio kursi berlengan modern, cahaya alami
    gambar contoh pencahayaan dramatis
    Perintah: foto studio kursi berlengan modern, cahaya dramatis
  4. Setelan Kamera - motion blur, soft focus, bokeh, potret

    gambar contoh motion blur
    Perintah: foto kota dengan gedung pencakar langit dari dalam mobil dengan motion blur
    gambar contoh soft focus
    Perintah: Foto soft focus jembatan di kota perkotaan pada malam hari
  5. Jenis lensa - 35 mm, 50 mm, mata ikan, sudut lebar, makro

    gambar contoh lensa makro
    Perintah: foto daun, lensa makro
    gambar contoh lensa mata ikan
    Perintah: fotografi jalanan, kota New York, lensa mata ikan
  6. Jenis film - hitam dan putih, polaroid

    gambar sampel foto polaroid
    Perintah: potret polaroid yang memakai kacamata hitam
    gambar contoh foto hitam putih
    Perintah: foto hitam putih yang memakai kacamata hitam

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.

Ilustrasi dan seni

  • Perintah menyertakan: "painting dari...", "sketch dari..."

Gaya seni bervariasi mulai dari gaya monokrom seperti sketsa pensil, hingga seni digital yang sangat realistis. Misalnya, gambar berikut menggunakan perintah yang sama dengan gaya yang berbeda:

"[art style or creation technique] sedan listrik sporty sudut dengan pencakar langit di latar belakang"

gambar contoh karya seni
Perintah: Gambar dengan teknik pensil dari sudut...
gambar contoh karya seni
Perintah: Gambar arang dari sudut...
gambar contoh karya seni
Perintah: Gambar pensil warna dari sudut...
gambar contoh karya seni
Perintah: Lukisan pastel dari sudut...
gambar contoh karya seni
Perintah: Seni digital dari sudut...
gambar contoh karya seni
Perintah: Art deco (poster) dari sudut...

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 2.

Bentuk dan bahan

  • Perintah mencakup: "...terbuat dari...", "...dalam bentuk..."

Salah satu keunggulan teknologi ini adalah Anda dapat membuat citra yang sulit atau tidak mungkin dilakukan. Misalnya, Anda dapat membuat ulang logo perusahaan dengan bahan dan tekstur yang berbeda.

contoh gambar bentuk dan bahan 1
Perintah: tas wol terbuat dari keju
contoh gambar bentuk dan bahan 2
Perintah: tabung neon berbentuk burung
contoh gambar 3 bentuk dan bahan 3
Perintah: kursi berlengan terbuat dari kertas, foto studio, gaya origami

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.

Referensi seni bersejarah

  • Perintah mencakup: "...dalam gaya..."

Gaya tertentu telah menjadi ikon selama bertahun-tahun. Berikut adalah beberapa ide lukisan sejarah atau gaya seni yang dapat Anda coba.

"buat gambar dengan gaya [art period or movement] : ladang kincir angin"

gambar contoh impresionisme
Perintah: buat gambar dengan gaya lukisan impresionis: ladang kincir angin
gambar contoh renaisans
Perintah: buat gambar dengan gaya lukisan renaisans: ladang kincir angin
gambar contoh seni pop
Perintah: buat gambar dengan gaya seni pop: ladang kincir angin

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.

Pengubah kualitas gambar

Kata kunci tertentu dapat memberi tahu model bahwa Anda mencari aset berkualitas tinggi. Contoh pengubah kualitas mencakup hal berikut:

  • Pengubah Umum - berkualitas tinggi, indah, bergaya
  • Foto - 4K, HDR, Foto Studio
  • Seni, Ilustrasi - oleh profesional, mendetail

Berikut adalah beberapa contoh perintah tanpa pengubah kualitas dan perintah yang sama dengan pengubah kualitas.

gambar contoh jagung tanpa pengubah
Perintah (tanpa pengubah kualitas): foto batang jagung
gambar contoh jagung dengan pengubah
Perintah (dengan pengubah kualitas): Foto 4k HDR yang indah
dari sebuah foto batang jagung diambil oleh
fotografer profesional

Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.

Rasio aspek

Pembuatan gambar Imagen 3 memungkinkan Anda menetapkan lima rasio aspek gambar yang berbeda.

  1. Persegi (1:1, default) - Foto persegi standar. Penggunaan umum untuk rasio aspek ini mencakup postingan media sosial.
  2. Layar penuh (4:3) - Rasio aspek ini biasanya digunakan dalam media atau film. Dimensi ini juga merupakan dimensi sebagian besar TV lama (non-layar lebar) dan kamera format sedang. Rasio ini menangkap lebih banyak pemandangan secara horizontal (dibandingkan dengan 1:1), sehingga menjadi rasio aspek yang lebih disukai untuk fotografi.

    contoh rasio aspek
    Perintah: close up jari musisi yang bermain piano, film hitam putih, vintage (rasio aspek 4:3)
    contoh rasio aspek
    Perintah: Foto studio profesional dari kentang goreng untuk restoran kelas atas, dengan gaya majalah makanan (rasio aspek 4:3)
  3. Layar penuh potret (3:4) - Ini adalah rasio aspek layar penuh yang diputar 90 derajat. Hal ini memungkinkan pengambilan lebih banyak scene secara vertikal dibandingkan dengan rasio aspek 1:1.

    contoh rasio aspek
    Perintah: seorang wanita yang sedang mendaki, dekat dengan sepatunya yang terpantul di genangan air, gunung besar di latar belakang, dalam gaya iklan, sudut dramatis (rasio aspek 3:4)
    contoh rasio aspek
    Perintah: gambar udara sungai yang mengalir di lembah mistis (rasio aspek 3:4)
  4. Layar lebar (16:9) - Rasio ini telah menggantikan 4:3 dan kini menjadi rasio aspek yang paling umum untuk TV, monitor, dan layar ponsel (lanskap). Gunakan rasio aspek ini jika Anda ingin mengambil lebih banyak latar belakang (misalnya, lanskap yang indah).

    contoh rasio aspek
    Perintah: seorang pria mengenakan pakaian serba putih yang duduk di pantai, close up, pencahayaan golden hour (rasio aspek 16:9)
  5. Potret (9:16) - Rasio ini adalah layar lebar, tetapi diputar. Ini adalah rasio aspek yang relatif baru yang telah dipopulerkan oleh aplikasi video pendek (misalnya, YouTube Shorts). Gunakan ini untuk objek tinggi dengan orientasi vertikal yang kuat seperti bangunan, pohon, air terjun, atau objek serupa lainnya.

    contoh rasio aspek
    Perintah: render digital dari gedung pencakar langit besar, modern, megah, epik dengan matahari terbenam yang indah di latar belakang (rasio aspek 9:16)

Gambar fotorealistik

Versi model pembuatan gambar yang berbeda mungkin menawarkan campuran output artistik dan fotorealistik. Gunakan kata-kata berikut dalam perintah untuk menghasilkan output yang lebih fotorealistik, berdasarkan subjek yang ingin Anda buat.

Kasus penggunaan Jenis lensa Panjang fokus Detail tambahan
Orang (potret) Tanda petik, zoom 24-35mm film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna)
Makanan, serangga, tanaman (objek, benda mati) Macro 60-105mm Detail tinggi, fokus presisi, pencahayaan terkontrol
Olahraga, satwa liar (gerakan) Zoom telefoto 100-400mm Kecepatan shutter cepat, Pelacakan tindakan atau gerakan
Astronomi, lanskap (sudut lebar) Sudut lebar 10-24mm Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus

Potret

Kasus penggunaan Jenis lensa Panjang fokus Detail tambahan
Orang (potret) Tanda petik, zoom 24-35mm film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna)

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan potret berikut:

contoh fotografi potret contoh fotografi potret contoh fotografi potret contoh fotografi potret

Perintah: Wanita, potret 35 mm, duotone biru dan abu-abu
Model: imagen-3.0-generate-002

contoh fotografi potret contoh fotografi potret contoh fotografi potret contoh fotografi potret

Perintah: Seorang wanita, potret 35 mm, film noir
Model: imagen-3.0-generate-002

Objek

Kasus penggunaan Jenis lensa Panjang fokus Detail tambahan
Makanan, serangga, tanaman (objek, benda mati) Macro 60-105mm Detail tinggi, fokus presisi, pencahayaan terkontrol

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar objek berikut:

contoh fotografi objek contoh fotografi objek contoh fotografi objek contoh fotografi objek

Perintah: daun tanaman doa, lensa makro, 60 mm
Model: imagen-3.0-generate-002

contoh fotografi objek contoh fotografi objek contoh fotografi objek contoh fotografi objek

Perintah: sepiring pasta, Lensa Makro 100 mm
Model: imagen-3.0-generate-002

Gerakan

Kasus penggunaan Jenis lensa Panjang fokus Detail tambahan
Olahraga, satwa liar (gerakan) Zoom telefoto 100-400mm Kecepatan shutter cepat, Pelacakan tindakan atau gerakan

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar gerakan berikut:

contoh fotografi gerakan contoh fotografi gerakan contoh fotografi gerakan contoh fotografi gerakan

Perintah: touchdown yang menentukan kemenangan, kecepatan shutter yang cepat, pelacakan gerakan
Model: imagen-3.0-generate-002

contoh fotografi gerakan contoh fotografi gerakan contoh fotografi gerakan contoh fotografi gerakan

Perintah: Rusa berlari di hutan, kecepatan shutter cepat, pelacakan gerakan
Model: imagen-3.0-generate-002

Sudut lebar

Kasus penggunaan Jenis lensa Panjang fokus Detail tambahan
Astronomi, lanskap (sudut lebar) Sudut lebar 10-24mm Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus

Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan gambar sudut lebar berikut:

contoh fotografi sudut lebar contoh fotografi sudut lebar contoh fotografi sudut lebar contoh fotografi sudut lebar

Perintah: pegunungan yang luas, sudut lebar lanskap 10 mm
Model: imagen-3.0-generate-002

contoh fotografi sudut lebar contoh fotografi sudut lebar contoh fotografi sudut lebar contoh fotografi sudut lebar

Perintah: foto bulan, fotografi astro, sudut lebar 10 mm
Model: imagen-3.0-generate-002

Langkah berikutnya