يمكنك إنشاء صور باستخدام Gemini API باستخدام ميزات Gemini المضمّنة للوسائط المتعددة أو Imagen، وهو نموذج Google المخصّص لإنشاء الصور. في معظم حالات الاستخدام، ابدأ باستخدام Gemini. اختَر Imagen للمهام المخصّصة التي تكون فيها جودة الصورة ضرورية. اطّلِع على قسم اختيار النموذج المناسب للحصول على مزيد من الإرشادات.
تتضمّن جميع الصور التي يتم إنشاؤها علامة مائية SynthID.
قبل البدء
تأكَّد من استخدام نموذج وإصدار متوافقَين لإنشاء الصور:
بالنسبة إلى Gemini، استخدِم نموذج Gemini 2.0 Flash التجريبي.
بالنسبة إلى Imagen، استخدِم Imagen 3. تجدر الإشارة إلى أنّ هذا النموذج متاح فقط في الخطّة المدفوعة.
يمكنك الوصول إلى كلّ من Gemini وImagen 3 باستخدام المكتبات نفسها.
إنشاء صور باستخدام Gemini
يمكن لـ Gemini إنشاء الصور ومعالجتها في إطار المحادثة. يمكنك توجيه Gemini باستخدام نص أو صور أو مزيج من الاثنين لتنفيذ مهام مختلفة متعلقة بالصور، مثل إنشاء الصور وتعديلها.
يجب تضمين responseModalities
: ["TEXT", "IMAGE"]
في ملف ملف
الإعدادات. لا تتوفّر إمكانية عرض الصور فقط باستخدام هذه النماذج.
إنشاء الصور (التحويل من نص إلى صورة)
توضِّح التعليمة البرمجية التالية كيفية إنشاء صورة استنادًا إلى طلب وصفي:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-exp-image-generation",
genai.Text("Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?"),
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

تعديل الصور (تحويل النص والصورة إلى صورة)
لإجراء تعديل على الصورة، أضِف صورة كمدخل. يوضّح المثال التاليتحميل صور بترميز base64. بالنسبة إلى الصور المتعدّدة وحمولات العميل الأكبر حجمًا، راجِع قسم إدخال الصور.
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
imagePath := "/path/to/image.png"
imgData, _ := os.ReadFile(imagePath)
parts := []*genai.Part{
genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
&genai.Part{
InlineData: &genai.Blob{
MIMEType: "image/png",
Data: imgData,
},
},
}
contents := []*genai.Content{
genai.NewContentFromParts(parts, genai.RoleUser),
}
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-exp-image-generation",
contents,
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
أوضاع إنشاء الصور الأخرى
تتيح ميزة Gemini أوضاع تفاعل أخرى مع الصور استنادًا إلى بنية الطلب و سياقه، بما في ذلك:
- النص إلى صور ونصوص (متداخلة): لإنشاء صور تتضمّن نصًا ذا صلة
- مثال على طلب: "أريد إنشاء وصفة مُوضَّحة لتحضير طبق البايلا".
- تحويل الصور والنصوص إلى صور ونصوص (متداخلة): يستخدم هذا الخيار الصور والنصوص التي يتم إدخالها لإنشاء صور ونصوص جديدة ذات صلة.
- مثال على طلب: (مع صورة لغرفة مفروشة) "ما هي الألوان الأخرى للأرائك التي تناسب مساحتي؟ هل يمكنك تعديل الصورة؟"
- تعديل الصور في محادثات متعددة (الدردشة): يمكنك مواصلة إنشاء الصور أو تعديلها في محادثة.
- أمثلة على الطلبات: [upload an image of a blue car.] "أريد تحويل هذه السيارة إلى سيارة قابلة للتحويل".، "الآن، غيِّر اللون إلى الأصفر".
القيود
- للحصول على أفضل أداء، استخدِم اللغات التالية: EN وes-MX وja-JP وzh-CN و hi-IN.
- لا تتيح ميزة إنشاء الصور إدخالات صوتية أو فيديوهات.
- قد لا يتم إنشاء الصور في الحالات التالية:
- قد يعرض النموذج نصًا فقط. جرِّب طلب نتائج الصور صراحةً (مثل "إنشاء صورة" أو "تقديم صور أثناء الإجراء" أو "تعديل الصورة").
- قد يتوقف النموذج عن إنشاء المحتوى في منتصف العملية. يُرجى إعادة المحاولة أو استخدام طلب مختلف.
- عند إنشاء نص لصورة، يعمل Gemini بشكل أفضل إذا أنشأت أولاً النص ثم طلبت صورة تتضمّن النص.
- لا تتوفّر ميزة "إنشاء الصور" في بعض المناطق أو البُلدان. يمكنك الاطّلاع على النماذج للحصول على مزيد من المعلومات.
إنشاء صور باستخدام Imagen 3
يوضّح هذا المثال إنشاء صور باستخدام Imagen 3:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-3.0-generate-002",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

مَعلمات نموذج Imagen
تتيح Imagen الطلبات باللغة الإنجليزية فقط في الوقت الحالي والمَعلمات التالية:
-
numberOfImages
: عدد الصور المطلوب إنشاؤها، من 1 إلى 4 (شاملة). القيمة التلقائية هي 4. aspectRatio
: لتغيير نسبة العرض إلى الارتفاع للصورة التي تم إنشاؤها القيم المتوافقة هي"1:1"
و"3:4"
و"4:3"
و"9:16"
و"16:9"
. القيمة التلقائية هي"1:1"
.personGeneration
: اسمح للنموذج بإنشاء صور لأشخاص. في ما يلي القيم المتوافقة:"DONT_ALLOW"
: حظر إنشاء صور للأشخاص"ALLOW_ADULT"
: إنشاء صور لأشخاص بالغين، ولكن ليس للأطفال هذا هو الخيار التلقائي.
اختيار النموذج المناسب
اختَر Gemini في الحالات التالية:
- يجب أن تكون الصور ذات صلة بالسياق وتستفيد من المعرفة والتفكير العالميين.
- من المهم دمج النصوص والصور بسلاسة.
- إذا كنت تريد تضمين مرئيات دقيقة في تسلسلات نصية طويلة
- إذا كنت تريد تعديل الصور بشكل تفاعلي مع الحفاظ على السياق
اختَر Imagen 3 في الحالات التالية:
- إنّ جودة الصورة أو الواقعية الفوتوغرافية أو التفاصيل الفنية أو الأنماط المحدّدة (مثل الانطباعية والأنمي) هي أهم الأولويات.
- تنفيذ مهام تعديل مخصّصة، مثل تعديل خلفية المنتج أو زيادة كثافة بكسل الصور
- دمج العلامة التجارية أو الأسلوب أو إنشاء الشعارات وتصاميم المنتجات
دليل طلبات Imagen
يوضّح لك هذا القسم من دليل Imagen كيفية تعديل طلب تحويل النص إلى صورة لتحقيق نتائج مختلفة، بالإضافة إلى أمثلة على الصور التي يمكنك إنشاؤها.
أساسيات كتابة الطلبات
يكون الطلب الجيد وصفيًا وواضحًا، ويستخدم كلمات رئيسية و مُعدِّلات ذات مغزى. ابدأ بالتفكير في الموضوع والسياق والأسلوب.

الموضوع: أول ما يجب التفكير فيه عند استخدام أي طلب هو الموضوع: الكائن أو الشخص أو الحيوان أو المشهد الذي تريد الحصول على صورة له.
السياق والخلفية: لا يقلّ الخلفية أو السياق الذي سيتم وضع الهدف فيه أهمية عن الهدف نفسه. جرِّب وضع الهدف في مجموعة متنوعة من الخلفيات. على سبيل المثال، استوديو بخلفية بيضاء أو أماكن خارجية أو أماكن داخلية
النمط: أخيرًا، أضِف نمط الصورة الذي تريده. يمكن أن تكون الأنماط عامة (رسم أو صورة أو رسومات تخطيطية) أو محدّدة جدًا (رسم بالألوان المائية أو رسم بالفحم أو رسم ثلاثي الأبعاد إسقاطي). يمكنك أيضًا دمج الأنماط.
بعد كتابة نسخة أولى من الطلب، يمكنك تحسينه من خلال إضافة مزيد من التفاصيل إلى أن تصل إلى الصورة التي تريدها. التكرار مهم. ابدأ بتحديد الفكرة الأساسية، ثمّ حسِّنها ووسِّعها إلى أن تصبح الصورة التي تم إنشاؤها قريبة من رؤيتك.
![]() |
![]() |
![]() |
يمكن أن يحوّل تطبيق Imagen 3 أفكارك إلى صور مفصّلة، سواء كانت الطلبات قصيرة أو طويلة ومفصّلة. يمكنك تحسين رؤيتك من خلال طلبات متكرّرة، مع إضافة تفاصيل إلى أن تحصل على النتيجة المثالية.
تتيح لك الطلبات القصيرة إنشاء صورة بسرعة. ![]() |
تتيح لك الطلبات الأطول إضافة تفاصيل محدّدة وإنشاء صورتك. ![]() |
نصائح إضافية لكتابة طلبات Imagen:
- استخدام لغة وصفية: استخدِم الصفات والظروف التفصيلية لشدّ انتباه المستخدمين و تقديم صورة واضحة لـ Imagen 3.
- تقديم سياق: إذا لزم الأمر، يمكنك تضمين معلومات أساسية لمساعدة الذكاء الاصطناعي في فهم المحتوى.
- الإشارة إلى فنّانين أو أنماط معيّنة: إذا كان لديك أسلوب جمالي معيّن في ذهنك، قد يكون من المفيد الإشارة إلى فنّانين أو حركات فنية معيّنة.
- استخدام أدوات هندسة الطلبات: ننصحك باستكشاف أدوات أو موارد هندسة الطلبات لمساعدتك في تحسين طلباتك وتحقيق أفضل النتائج.
- تحسين تفاصيل الوجه في الصور الشخصية والجماعية: حدِّد تفاصيل الوجه كعنصر رئيسي في الصورة (على سبيل المثال، استخدِم الكلمة "بورتريه" في الطلب).
إنشاء نص في الصور
يمكن أن تضيف Imagen نصًا إلى الصور، ما يفتح المزيد من احتمالات إنشاء صور مبتكرة. اتّبِع الإرشادات التالية للاستفادة إلى أقصى حدّ من هذه الميزة:
- تكرار الخطوات بثقة: قد تحتاج إلى إعادة إنشاء الصور إلى أن تتمكّن من تحقيق المظهر الذي تريده. لا تزال عملية دمج النصوص في Imagen في مرحلة التطور، وفي بعض الأحيان تؤدي المحاولات المتعدّدة إلى تحقيق أفضل النتائج.
- اختصار النص: يجب أن يتألف النص من 25 حرفًا أو أقل لضمان OPTIMAL الإنشاء.
عبارات متعددة: جرِّب عبارةَين أو ثلاث عبارات مختلفة لتوفير معلومات إضافية. تجنَّب استخدام أكثر من ثلاث عبارات لإنشاء تركيبات تصاميم أنظف.
الطلب: ملصق يتضمّن النص "Summerland" بخط عريض كه عنوان ، وتحت هذا النص يظهر الشعار "Summer never felt so good" توجيه مواضع النص: على الرغم من أنّ Imagen يمكن أن تحاول وضع النص على النحو المُوجَّه، توقّع حدوث اختلافات من حين لآخر. نحن نعمل باستمرار على تحسين هذه الميزة.
نمط الخط المستوحى: حدِّد نمط خط عام للتأثير بشكلٍ دقيق في خيارات Imagen. لا تعتمد على تكرار الخط بدقة، ولكن توقّع تفسيرات إبداعية.
حجم الخط: حدِّد حجم خط أو إشارة عامة إلى الحجم (مثل صغير أو متوسط أو كبير) للتأثير في عملية إنشاء حجم الخط.
إعداد مَعلمات الطلب
للتحكّم بشكل أفضل في نتائج الإخراج، قد يكون من المفيد وضع مَعلمات للمدخلات في Imagen. على سبيل المثال، لنفترض أنّك تريد أن يتمكّن عملاؤك من إنشاء شعارات لنشاطاتهم التجارية، و تريد التأكّد من إنشاء الشعارات دائمًا على خلفية بلون واحد. وبإمكانك أيضًا تحديد الخيارات التي يمكن للعميل اختيارها من القائمة.
في هذا المثال، يمكنك إنشاء طلب مُحدَّد بالمَعلمات مشابهًا للطلب التالي:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
في واجهة المستخدم المخصّصة، يمكن للعميل إدخال المَعلمات باستخدام قائمة، وتعبِّئ القيمة التي يختارها الطلب الذي تتلقّاه Imagen.
على سبيل المثال:
الطلب:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
الطلب:
A modern logo for a software company on a solid color background. Include the text Silo.
الطلب:
A traditional logo for a baking company on a solid color background. Include the text Seed.
أساليب كتابة الطلبات المتقدّمة
استخدِم الأمثلة التالية لإنشاء طلبات أكثر تحديدًا استنادًا إلى السمات، مثل أوصاف الصور الفوتوغرافية والأشكال والمواد وحركات الفن التاريخي وعوامل تعديل جودة الصورة.
التصوير الفوتوغرافي
- تتضمّن الرسالة المطالبة ما يلي: "صورة..."
لاستخدام هذا النمط، ابدأ باستخدام كلمات رئيسية تُعلم Imagen بوضوح أنّك تبحث عن صورة فوتوغرافية. ابدأ طلباتك بعبارة "صورة لـ . .". على سبيل المثال:
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
عناصر تعديل الصور
في الأمثلة التالية، يمكنك الاطّلاع على العديد من المُعدِّلات والمَعلمات المتعلّقة بالتصوير الفوتوغرافي. يمكنك الجمع بين عدّة عوامل تعديل للتحكّم بشكل أدق.
قرب الكاميرا: صورة مقرّبة تم التقاطها من مسافة بعيدة
الطلب: صورة مقرّبة لحبوب القهوة الطلب: صورة مكبّرة لحقيبة صغيرة من
حبوب القهوة في مطبخ فوضويموضع الكاميرا: من الجو، من الأسفل
الطلب: صورة من الجو لمدينة حضرية بها ناطحات سحاب الطلب: صورة لظلة غابة مع سماء زرقاء من الأسفل الإضاءة: طبيعية، مميّزة، دافئة، باردة
الطلب: صورة استوديو لكرسي بذراعَين حديث، بإضاءة طبيعية الطلب: صورة استوديو لكرسي بذراعَين حديث، بإضاءة درامية إعدادات الكاميرا - تمويه الحركة والتركيز الناعم والتأثير البؤري ووضع "بورتريه"
الطلب: صورة لمدينة بها ناطحات سحاب من داخل سيارة مع تمويه الحركة الطلب: صورة بتركيز خفيف لجسر في مدينة حضرية ليلاً أنواع العدسات: 35 ملم و50 ملم وعدسة عين السمكة وعدسة بزاوية واسعة وعدسة الماكرو
الطلب: صورة لورقة شجر، عدسة مقرّبة الطلب: تصوير الشوارع، مدينة نيويورك، عدسة عين السمكة أنواع الأفلام: أبيض وأسود، بولارويد
الطلب: صورة بانورامية لكلب يرتدي نظّارات شمسية الطلب: صورة بالأبيض والأسود لكلب يرتدي نظّارات شمسية
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
الرسوم التوضيحية والفنون
- تتضمّن الرسالة المطالبة: "painting من..."، "sketch من..."
تتنوع أنماط الأعمال الفنية من الأنماط أحادية اللون، مثل الرسومات بالقلم الرصاص، إلى الفن الرقمي الفائق الواقعية. على سبيل المثال، تستخدم الصور التالية الطلب نفسه بأسلوبين مختلفين:
"[art style or creation technique] لسيارة كهربائية رياضية ملفتة للعيان بتصميم مستقيم مع ناطحات سحاب في الخلفية"
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
مصدر الصور: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 2.
الأشكال والمواد
- تتضمّن الرسالة المطالبة: "...مصنوعة من..."، "...في شكل..."
من نقاط قوة هذه التكنولوجيا أنّه يمكنك إنشاء صور يصعب أو يستحيل الحصول عليها بغير هذه الطريقة. على سبيل المثال، يمكنك إعادة إنشاء شعار شركتك باستخدام مواد وأشكال مختلفة.
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
مراجع الفنّ التاريخي
- تتضمّن الرسالة المطالبة ما يلي: "...بأسلوب..."
وقد أصبحت بعض الأنماط رمزية على مرّ السنين. في ما يلي بعض الأفكار عن الرسم أو الأساليب الفنية التاريخية التي يمكنك تجربتها.
"إنشاء صورة بأسلوب [art period or movement] : مزرعة رياح"
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
عوامل تعديل جودة الصورة
يمكن أن تُعلم كلمات رئيسية معيّنة النموذج بأنّك تبحث عن مادة عرض عالية الجودة. تشمل أمثلة عوامل تعديل الجودة ما يلي:
- العناصر المعدِّلة العامة: عالية الجودة وجميلة وذات تصميم فني
- الصور: 4K وHDR و"صور الاستوديو"
- الأعمال الفنية والرسوم التوضيحية: من إعداد فنان محترف ومفصّل
في ما يلي بعض الأمثلة على الطلبات بدون عوامل تعديل الجودة والطلب نفسه مع عوامل تعديل الجودة.
![]() |
![]() لساقه ذرة التقطها مصور فوتوغرافي محترف |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
نِسب العرض إلى الارتفاع
تتيح لك ميزة إنشاء الصور في Imagen 3 ضبط خمس نسب عرض إلى ارتفاع مختلفة للصور.
- مربّعة (1:1، الإعداد التلقائي) - صورة مربّعة عادية. تشمل الاستخدامات الشائعة لهذه التناسب المشاركات على وسائل التواصل الاجتماعي.
ملء الشاشة (4:3): تُستخدَم نسبة العرض إلى الارتفاع هذه بشكل شائع في الوسائط أو الأفلام. وهي أيضًا أبعاد معظم أجهزة التلفزيون القديمة (غير ذات الشاشة العريضة) والكاميرات ذات التنسيق المتوسط. وتلتقط هذه النسبة المزيد من المشهد أفقيًا (مقارنةً بنسبة 1:1)، ما يجعلها نسبة العرض إلى الارتفاع المفضّلة للتصوير الفوتوغرافي.
الطلب: لقطة مقرّبة لأصابع موسيقي وهو يعزف على البيانو، فيلم أبيض وأسود قديم (نسبة عرض إلى ارتفاع 4:3) الطلب: صورة احترافية في الاستوديو لوجبة من البطاطس المقلية في مطعم فاخر، بأسلوب مجلّة طعام (نسبة العرض إلى الارتفاع 4:3) ملء الشاشة في الوضع العمودي (3:4): هذه هي نسبة العرض إلى الارتفاع في وضع ملء الشاشة بعد تدويرها 90 درجة. يتيح لك ذلك التقاط المزيد من المشهد بشكل عمودي مقارنةً بنسبة العرض إلى الارتفاع التي تبلغ 1:1.
الطلب: امرأة تمارس رياضة المشي لمسافات طويلة، لقطة مقرّبة من أحذيتها المنعكسة في بركة، جبال كبيرة في الخلفية، بأسلوب إعلاني، زوايا درامية (نسبة العرض إلى الارتفاع 3:4) الطلب: لقطة جوية لنهر يجري في وادي سحري (نسبة العرض إلى الارتفاع 3:4) شاشة عريضة (16:9): حلّت هذه النسبة محلّ نسبة 4:3، وهي الآن نسبة العرض إلى الارتفاع الأكثر شيوعًا لأجهزة التلفزيون والشاشات وشاشات الهواتف الجوّالة (أفقية). استخدِم نسبة العرض إلى الارتفاع هذه عندما تريد تصوير المزيد من الخلفية (مثلاً، المناظر الطبيعية).
الطلب: رجل يرتدي ملابس بيضاء بالكامل ويجلس على الشاطئ، لقطة مقرّبة، إضاءة "ساعة الذهبية" (نسبة عرض إلى ارتفاع 16:9) عمودي (9:16): هذه نسبة شاشة عريضة ولكن تم تدويرها. هذه نسبة عرض إلى ارتفاع جديدة نسبيًا اشتهرت من خلال تطبيقات الفيديوهات القصيرة (مثل YouTube Shorts). استخدِم هذا الخيار للكائنات الطويلة ذات الاتجاهات العمودية القوية، مثل المباني أو الأشجار أو الشلالات أو غيرها من الكائنات المشابهة.
المطلوب: صورة رقمية لساعة ناطحة سحاب ضخمة، حديثة، فخمة، ملحمية مع غروب جميل في الخلفية (نسبة العرض إلى الارتفاع 9:16)
الصور الواقعية
قد توفّر الإصدارات المختلفة من نموذج إنشاء الصور مزيجًا من النتائج الفنية والواقعية. استخدِم العبارة التالية في الطلبات لإنشاء نتائج أكثر واقعية، استنادًا إلى الموضوع الذي تريد إنشاؤه.
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الأشخاص (صور الأشخاص) | تحسين الصورة، التكبير/التصغير | 24-35 مم | فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين) |
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) | وحدة الماكرو | 60-105 مم | تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم |
الرياضة والحياة البرية (متحرك) | التكبير/التصغير باستخدام العدسة المقرّبة | 100-400 مم | سرعة غالق سريعة أو تتبُّع الحركة أو الحدث |
صور فلكية، أفقية (بزاوية واسعة) | زاوية عريضة | 10-24 مم | أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة |
صور شخصية
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الأشخاص (صور الأشخاص) | تحسين الصورة، التكبير/التصغير | 24-35 مم | فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين) |
باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء ملفّات بورتريه التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: صورة امرأة بالوضع العمودي بتنسيق 35 مم بلونين أزرق ورمادي
الطراز: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: صورة امرأة بالأبيض والأسود مقاس 35 مم، فيلم نوار
النموذج: imagen-3.0-generate-002
العناصر
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) | وحدة الماكرو | 60-105 مم | تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم |
باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء صور الأجسام التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: ورقة نبات دعاء، عدسة مقرّبة، 60 مم
النموذج: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: طبق معكرونة، عدسة ماكرو بدقة 100 مم
النموذج: imagen-3.0-generate-002
الحركة
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الرياضة والحياة البرية (متحرك) | التكبير/التصغير باستخدام العدسة المقرّبة | 100-400 مم | سرعة غالق سريعة أو تتبُّع الحركة أو الحدث |
باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور المتحركة التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: هدف الفوز، سرعة غالق سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: غزال يركض في الغابة، سرعة التقاط سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002
زاوية عريضة
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
صور فلكية، أفقية (بزاوية واسعة) | زاوية عريضة | 10-24 مم | أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة |
باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور التالية بزاوية واسعة:
![]() |
![]() |
![]() |
![]() |
الطلب: سلسلة جبلية شاسعة، زاوية عريضة أفقية 10 مم
النموذج: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: صورة للقمر، تصوير فلكي، زاوية واسعة 10 مم
طراز الجهاز: imagen-3.0-generate-002
الخطوات التالية
- اطّلِع على دليل Veo للتعرّف على كيفية إنشاء الفيديوهات باستخدام Gemini API.
- لمزيد من المعلومات عن نماذج Gemini 2.0، اطّلِع على نماذج Gemini والنماذج التجريبية.