Anda dapat membuat gambar menggunakan Gemini API dengan kemampuan multimodal bawaan Gemini atau Imagen, model pembuatan gambar khusus Google. Untuk sebagian besar kasus penggunaan, mulailah dengan Gemini. Pilih Imagen untuk tugas khusus yang memerlukan kualitas gambar yang sangat baik. Lihat bagian Memilih model yang tepat untuk panduan selengkapnya.
Semua gambar yang dihasilkan menyertakan watermark SynthID.
Sebelum memulai
Pastikan Anda menggunakan model dan versi yang didukung untuk pembuatan gambar:
Untuk Gemini, gunakan Pembuatan Gambar Pratinjau Flash Gemini 2.0.
Untuk Imagen, gunakan Imagen 3. Perhatikan bahwa model ini hanya tersedia di Paket berbayar.
Anda dapat mengakses Gemini dan Imagen 3 menggunakan library yang sama.
Membuat gambar menggunakan Gemini
Gemini dapat membuat dan memproses gambar secara percakapan. Anda dapat meminta Gemini dengan teks, gambar, atau kombinasi keduanya untuk menyelesaikan berbagai tugas terkait gambar, seperti pembuatan dan pengeditan gambar.
Anda harus menyertakan responseModalities
: ["TEXT", "IMAGE"]
dalam
konfigurasi. Output khusus gambar tidak didukung dengan model ini.
Pembuatan gambar (teks ke gambar)
Kode berikut menunjukkan cara membuat gambar berdasarkan perintah deskriptif:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-preview-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-preview-image-generation",
genai.Text("Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?"),
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

Pengeditan gambar (teks dan gambar ke gambar)
Untuk melakukan pengeditan gambar, tambahkan gambar sebagai input. Contoh berikut menunjukkan cara mengupload gambar yang dienkode base64. Untuk beberapa gambar dan payload yang lebih besar, lihat bagian input gambar.
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-preview-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
imagePath := "/path/to/image.png"
imgData, _ := os.ReadFile(imagePath)
parts := []*genai.Part{
genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
&genai.Part{
InlineData: &genai.Blob{
MIMEType: "image/png",
Data: imgData,
},
},
}
contents := []*genai.Content{
genai.NewContentFromParts(parts, genai.RoleUser),
}
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-preview-image-generation",
contents,
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
Mode pembuatan gambar lainnya
Gemini mendukung mode interaksi gambar lainnya berdasarkan struktur perintah dan konteks, termasuk:
- Teks ke gambar dan teks (disisipkan): Menghasilkan gambar dengan teks terkait.
- Contoh perintah: "Buat resep bergambar untuk paella".
- Gambar dan teks ke gambar dan teks (disisipkan): Menggunakan gambar dan teks input untuk membuat gambar dan teks terkait baru.
- Contoh perintah: (Dengan gambar ruangan yang dilengkapi furnitur) "Sofa warna apa yang cocok untuk ruangan saya? Bisakah Anda memperbarui gambarnya?"
- Pengeditan gambar multi-giliran (chat): Terus buat / edit gambar secara percakapan.
- Contoh perintah: [upload gambar mobil biru.] , "Ubah mobil ini menjadi mobil konversi", "Sekarang ubah warnanya menjadi kuning."
Batasan
- Untuk performa terbaik, gunakan bahasa berikut: EN, es-MX, ja-JP, zh-CN, hi-IN.
- Pembuatan gambar tidak mendukung input audio atau video.
- Pembuatan gambar mungkin tidak selalu memicu:
- Model hanya dapat menghasilkan teks. Coba minta output gambar secara eksplisit (misalnya, "buat gambar", "berikan gambar saat Anda melakukannya", "perbarui gambar").
- Model mungkin berhenti menghasilkan di tengah jalan. Coba lagi atau coba perintah lain.
- Saat membuat teks untuk gambar, Gemini berfungsi paling baik jika Anda membuat teks terlebih dahulu, lalu meminta gambar dengan teks tersebut.
- Ada beberapa wilayah/negara tempat Pembuatan gambar tidak tersedia. Lihat Model untuk mengetahui informasi selengkapnya.
Membuat gambar menggunakan Imagen 3
Contoh ini menunjukkan pembuatan gambar dengan Imagen 3:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-3.0-generate-002",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

Parameter model Imagen
Saat ini, Imagen hanya mendukung perintah dalam bahasa Inggris dan parameter berikut:
numberOfImages
: Jumlah gambar yang akan dihasilkan, dari 1 hingga 4 (inklusif). Defaultnya adalah 4.aspectRatio
: Mengubah rasio aspek gambar yang dihasilkan. Nilai yang didukung adalah"1:1"
,"3:4"
,"4:3"
,"9:16"
, dan"16:9"
. Defaultnya adalah"1:1"
.personGeneration
: Mengizinkan model membuat gambar orang. Nilai berikut didukung:"DONT_ALLOW"
: Memblokir pembuatan gambar orang."ALLOW_ADULT"
: Membuat gambar orang dewasa, tetapi tidak untuk anak-anak. Ini adalah defaultnya.
Memilih model yang tepat
Pilih Gemini jika:
- Anda memerlukan gambar yang relevan secara kontekstual yang memanfaatkan pengetahuan dan penalaran dunia.
- Menggabungkan teks dan gambar dengan lancar sangatlah penting.
- Anda ingin visual yang akurat disematkan dalam urutan teks yang panjang.
- Anda ingin mengedit gambar secara percakapan sambil mempertahankan konteks.
Pilih Imagen 3 jika:
- Kualitas gambar, fotorealisme, detail artistik, atau gaya tertentu (misalnya, impresionisme, anime) adalah prioritas utama.
- Melakukan tugas pengeditan khusus seperti pembaruan latar belakang produk atau peningkatan dimensi gambar.
- Menerapkan branding, gaya, atau membuat logo dan desain produk.
Panduan perintah Imagen
Bagian panduan Imagen ini menunjukkan cara memodifikasi perintah teks ke gambar dapat menghasilkan hasil yang berbeda, beserta contoh gambar yang dapat Anda buat.
Dasar-dasar penulisan perintah
Perintah yang baik bersifat deskriptif dan jelas, serta menggunakan kata kunci dan pengubah yang bermakna. Mulailah dengan memikirkan subjek, konteks, dan gaya Anda.

Subjek: Hal pertama yang harus dipikirkan dengan perintah apa pun adalah subjek: objek, orang, hewan, atau pemandangan yang Anda inginkan gambarnya.
Konteks dan latar belakang: Sama pentingnya adalah latar belakang atau konteks tempat subjek akan ditempatkan. Coba tempatkan subjek di berbagai latar belakang. Misalnya, studio dengan latar belakang putih, di luar ruangan, atau di dalam ruangan.
Gaya: Terakhir, tambahkan gaya gambar yang Anda inginkan. Gaya dapat bersifat umum (lukisan, foto, sketsa) atau yang sangat spesifik (lukisan pastel, gambar arang, 3D isometrik). Anda juga dapat menggabungkan gaya.
Setelah menulis versi pertama perintah, pertajam perintah dengan menambahkan detail lainnya hingga Anda mendapatkan gambar yang diinginkan. Iterasi adalah hal penting. Mulailah dengan menetapkan ide inti, lalu pertajam dan perluas ide inti tersebut hingga gambar yang dihasilkan mendekati visi Anda.
![]() |
![]() |
![]() |
Imagen 3 dapat mengubah ide Anda menjadi gambar mendetail, baik perintah Anda singkat maupun panjang dan mendetail. Tingkatkan visi Anda melalui perintah berulang, tambahkan detail hingga Anda mencapai hasil yang sempurna.
Perintah singkat memungkinkan Anda membuat gambar dengan cepat. ![]() |
Perintah yang lebih panjang memungkinkan Anda menambahkan detail spesifik dan membuat gambar. ![]() |
Saran tambahan untuk menulis perintah Imagen:
- Gunakan bahasa deskriptif: Gunakan kata sifat dan kata keterangan yang mendetail untuk memberikan gambaran yang jelas untuk Imagen 3.
- Berikan konteks: Jika perlu, sertakan informasi latar belakang untuk membantu pemahaman AI.
- Mereferensikan artis atau gaya tertentu: Jika Anda memiliki estetika tertentu dalam pikiran, mereferensikan artis atau gerakan seni tertentu dapat membantu.
- Gunakan alat prompt engineering: Pertimbangkan untuk mempelajari alat atau referensi prompt engineering untuk membantu Anda meningkatkan kualitas perintah dan mencapai hasil yang optimal.
- Meningkatkan detail wajah dalam gambar pribadi dan grup Anda: Tentukan detail wajah sebagai fokus foto (misalnya, gunakan kata "potret" dalam perintah).
Membuat teks dalam gambar
Imagen dapat menambahkan teks ke dalam gambar, sehingga membuka lebih banyak kemungkinan pembuatan gambar yang kreatif. Gunakan panduan berikut untuk mendapatkan hasil maksimal dari fitur ini:
- Lakukan iterasi dengan percaya diri: Anda mungkin harus membuat ulang gambar hingga mencapai tampilan yang diinginkan. Integrasi teks Imagen masih berkembang, dan terkadang beberapa upaya menghasilkan hasil terbaik.
- Panjangnya singkat: Batasi teks hingga 25 karakter atau kurang untuk pembuatan yang optimal.
Beberapa frasa: Bereksperimenlah dengan dua atau tiga frasa yang berbeda untuk memberikan informasi tambahan. Hindari melebihi tiga frasa untuk komposisi yang lebih bersih.
Perintah: Poster dengan teks "Summerland" dalam font tebal sebagai judul, di bawah teks ini terdapat slogan "Summer never felt so good" Panduan Penempatan: Meskipun Imagen dapat mencoba memosisikan teks sesuai petunjuk, terkadang akan ada variasi. Fitur ini terus ditingkatkan.
Gaya font inspirasi: Tentukan gaya font umum untuk memengaruhi pilihan Imagen secara halus. Jangan mengandalkan replikasi font yang akurat, tetapi harapkan interpretasi materi iklan.
Ukuran font: Tentukan ukuran font atau indikasi ukuran umum (misalnya, kecil, sedang, besar) untuk memengaruhi pembuatan ukuran font.
Parameterisasi perintah
Untuk mengontrol hasil output dengan lebih baik, Anda mungkin perlu memparametrisasi input ke dalam Imagen. Misalnya, Anda ingin pelanggan dapat membuat logo untuk bisnis mereka, dan Anda ingin memastikan logo selalu dibuat dengan latar belakang warna solid. Anda juga ingin membatasi opsi yang dapat dipilih klien dari menu.
Dalam contoh ini, Anda dapat membuat perintah berparameter yang mirip dengan berikut:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
Di antarmuka pengguna kustom Anda, pelanggan dapat memasukkan parameter menggunakan menu, dan nilai yang dipilih akan mengisi perintah yang diterima Imagen.
Contoh:
Perintah:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
Perintah:
A modern logo for a software company on a solid color background. Include the text Silo.
Perintah:
A traditional logo for a baking company on a solid color background. Include the text Seed.
Teknik penulisan perintah lanjutan
Gunakan contoh berikut untuk membuat perintah yang lebih spesifik berdasarkan atribut seperti deskripsi fotografi, bentuk dan bahan, gerakan seni historis, dan pengubah kualitas gambar.
Fotografi
- Perintah menyertakan: "Foto..."
Untuk menggunakan gaya ini, mulai dengan menggunakan kata kunci yang dengan jelas memberi tahu Imagen bahwa Anda mencari foto. Mulailah perintah Anda dengan "Foto. . .". Misalnya:
![]() |
![]() |
![]() |
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.
Pengubah fotografi
Pada contoh berikut, Anda dapat melihat beberapa pengubah dan parameter khusus fotografi. Anda dapat menggabungkan beberapa pengubah untuk kontrol yang lebih akurat.
Kedekatan Kamera - Jarak dekat, diambil dari jarak jauh
Perintah: Foto biji kopi dari jarak dekat Perintah: Foto diperkecil sekantong kecil
biji kopi di dapur yang berantakanPosisi Kamera - dari atas, dari bawah
Perintah: foto udara kota perkotaan dengan gedung pencakar langit Perintah: Foto kanopi hutan dengan langit biru dari bawah Pencahayaan - alami, dramatis, hangat, dingin
Perintah: foto studio kursi berlengan modern, cahaya alami Perintah: foto studio kursi berlengan modern, cahaya dramatis Setelan Kamera - motion blur, soft focus, bokeh, potret
Perintah: foto kota dengan gedung pencakar langit dari dalam mobil dengan motion blur Perintah: Foto soft focus jembatan di kota perkotaan pada malam hari Jenis lensa - 35 mm, 50 mm, mata ikan, sudut lebar, makro
Perintah: foto daun, lensa makro Perintah: fotografi jalanan, kota New York, lensa mata ikan Jenis film - hitam dan putih, polaroid
Perintah: potret polaroid anjing yang memakai kacamata hitam Perintah: foto hitam putih anjing yang memakai kacamata hitam
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.
Ilustrasi dan seni
- Perintah menyertakan: "painting dari...", "sketch dari..."
Gaya seni bervariasi mulai dari gaya monokrom seperti sketsa pensil, hingga seni digital yang sangat realistis. Misalnya, gambar berikut menggunakan perintah yang sama dengan gaya yang berbeda:
"[art style or creation technique] sedan listrik sporty sudut dengan pencakar langit di latar belakang"
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 2.
Bentuk dan bahan
- Perintah mencakup: "...terbuat dari...", "...dalam bentuk..."
Salah satu keunggulan teknologi ini adalah Anda dapat membuat citra yang sulit atau tidak mungkin dilakukan. Misalnya, Anda dapat membuat ulang logo perusahaan dengan bahan dan tekstur yang berbeda.
![]() |
![]() |
![]() |
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.
Referensi seni bersejarah
- Perintah mencakup: "...dalam gaya..."
Gaya tertentu telah menjadi ikon selama bertahun-tahun. Berikut adalah beberapa ide lukisan sejarah atau gaya seni yang dapat Anda coba.
"buat gambar dengan gaya [art period or movement] : ladang kincir angin"
![]() |
![]() |
![]() |
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.
Pengubah kualitas gambar
Kata kunci tertentu dapat memberi tahu model bahwa Anda mencari aset berkualitas tinggi. Contoh pengubah kualitas mencakup hal berikut:
- Pengubah Umum - berkualitas tinggi, indah, bergaya
- Foto - 4K, HDR, Foto Studio
- Seni, Ilustrasi - oleh profesional, mendetail
Berikut adalah beberapa contoh perintah tanpa pengubah kualitas dan perintah yang sama dengan pengubah kualitas.
![]() |
![]() dari sebuah foto batang jagung diambil oleh fotografer profesional |
Sumber gambar: Setiap gambar dibuat menggunakan perintah teks yang sesuai dengan model Imagen 3.
Rasio aspek
Pembuatan gambar Imagen 3 memungkinkan Anda menetapkan lima rasio aspek gambar yang berbeda.
- Persegi (1:1, default) - Foto persegi standar. Penggunaan umum untuk rasio aspek ini mencakup postingan media sosial.
Layar penuh (4:3) - Rasio aspek ini biasanya digunakan dalam media atau film. Dimensi ini juga merupakan dimensi sebagian besar TV lama (non-layar lebar) dan kamera format sedang. Rasio ini menangkap lebih banyak pemandangan secara horizontal (dibandingkan dengan 1:1), sehingga menjadi rasio aspek yang lebih disukai untuk fotografi.
Perintah: close up jari-jari musisi yang bermain piano, film hitam putih, vintage (rasio aspek 4:3) Perintah: Foto studio profesional dari kentang goreng untuk restoran kelas atas, dengan gaya majalah makanan (rasio aspek 4:3) Layar penuh potret (3:4) - Ini adalah rasio aspek layar penuh yang diputar 90 derajat. Hal ini memungkinkan pengambilan lebih banyak scene secara vertikal dibandingkan dengan rasio aspek 1:1.
Perintah: seorang wanita yang sedang mendaki, close up sepatu botnya yang terpantul di genangan air, pegunungan besar di latar belakang, dalam gaya iklan, sudut dramatis (rasio aspek 3:4) Perintah: gambar udara sungai yang mengalir di lembah mistis (rasio aspek 3:4) Layar lebar (16:9) - Rasio ini telah menggantikan 4:3 dan kini menjadi rasio aspek yang paling umum untuk TV, monitor, dan layar ponsel (lanskap). Gunakan rasio aspek ini jika Anda ingin mengambil lebih banyak latar belakang (misalnya, lanskap yang indah).
Perintah: seorang pria mengenakan pakaian serba putih yang duduk di pantai, close up, pencahayaan golden hour (rasio aspek 16:9) Potret (9:16) - Rasio ini adalah layar lebar, tetapi diputar. Ini adalah rasio aspek yang relatif baru yang telah dipopulerkan oleh aplikasi video pendek (misalnya, YouTube Shorts). Gunakan ini untuk objek tinggi dengan orientasi vertikal yang kuat seperti bangunan, pohon, air terjun, atau objek serupa lainnya.
Perintah: render digital dari gedung pencakar langit besar, modern, megah, epik dengan matahari terbenam yang indah di latar belakang (rasio aspek 9:16)
Gambar fotorealistik
Versi model pembuatan gambar yang berbeda mungkin menawarkan campuran output artistik dan fotorealistik. Gunakan kata-kata berikut dalam perintah untuk menghasilkan output yang lebih fotorealistik, berdasarkan subjek yang ingin Anda buat.
Kasus penggunaan | Jenis lensa | Panjang fokus | Detail tambahan |
---|---|---|---|
Orang (potret) | Tanda petik, zoom | 24-35mm | film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna) |
Makanan, serangga, tanaman (objek, benda mati) | Macro | 60-105mm | Detail tinggi, fokus presisi, pencahayaan terkontrol |
Olahraga, satwa liar (gerakan) | Zoom telefoto | 100-400mm | Kecepatan shutter cepat, Pelacakan tindakan atau gerakan |
Astronomi, lanskap (sudut lebar) | Sudut lebar | 10-24mm | Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus |
Potret
Kasus penggunaan | Jenis lensa | Panjang fokus | Detail tambahan |
---|---|---|---|
Orang (potret) | Tanda petik, zoom | 24-35mm | film hitam putih, Film noir, Kedalaman bidang, duotone (sebutkan dua warna) |
Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan potret berikut:
![]() |
![]() |
![]() |
![]() |
Perintah: Wanita, potret 35 mm, duotone biru dan abu-abu
Model: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Perintah: Wanita, potret 35 mm, film noir
Model: imagen-3.0-generate-002
Objek
Kasus penggunaan | Jenis lensa | Panjang fokus | Detail tambahan |
---|---|---|---|
Makanan, serangga, tanaman (objek, benda mati) | Macro | 60-105mm | Detail tinggi, fokus presisi, pencahayaan terkontrol |
Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar objek berikut:
![]() |
![]() |
![]() |
![]() |
Perintah: daun tanaman doa, lensa makro, 60 mm
Model: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Perintah: sepiring pasta, Lensa Makro 100 mm
Model: imagen-3.0-generate-002
Gerakan
Kasus penggunaan | Jenis lensa | Panjang fokus | Detail tambahan |
---|---|---|---|
Olahraga, satwa liar (gerakan) | Zoom telefoto | 100-400mm | Kecepatan shutter cepat, Pelacakan tindakan atau gerakan |
Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat membuat gambar gerakan berikut:
![]() |
![]() |
![]() |
![]() |
Perintah: touchdown yang menentukan kemenangan, kecepatan shutter yang cepat, pelacakan gerakan
Model: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Perintah: Rusa berlari di hutan, kecepatan shutter cepat, pelacakan gerakan
Model: imagen-3.0-generate-002
Sudut lebar
Kasus penggunaan | Jenis lensa | Panjang fokus | Detail tambahan |
---|---|---|---|
Astronomi, lanskap (sudut lebar) | Sudut lebar | 10-24mm | Waktu eksposur panjang, fokus tajam, eksposur panjang, air atau awan yang halus |
Dengan menggunakan beberapa kata kunci dari tabel, Imagen dapat menghasilkan gambar sudut lebar berikut:
![]() |
![]() |
![]() |
![]() |
Perintah: pegunungan yang luas, sudut lebar lanskap 10 mm
Model: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Perintah: foto bulan, fotografi astro, sudut lebar 10 mm
Model: imagen-3.0-generate-002
Langkah berikutnya
- Lihat panduan Veo untuk mempelajari cara membuat video dengan Gemini API.
- Untuk mempelajari model Gemini 2.0 lebih lanjut, lihat Model Gemini dan Model eksperimental.