تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

إنشاء الصور

يمكنك إنشاء صور باستخدام Gemini API باستخدام ميزات Gemini المضمّنة للوسائط المتعددة أو Imagen، وهو نموذج Google المخصّص لإنشاء الصور. في معظم حالات الاستخدام، ابدأ باستخدام Gemini. اختَر Imagen للمهام المخصّصة التي تكون فيها جودة الصورة ضرورية. اطّلِع على قسم اختيار النموذج المناسب للحصول على مزيد من الإرشادات.

تتضمّن جميع الصور التي يتم إنشاؤها علامة مائية SynthID.

قبل البدء

تأكَّد من استخدام نموذج وإصدار متوافقَين لإنشاء الصور:

بالنسبة إلى Gemini، استخدِم ميزة "إنشاء الصور" في ميزة "العرض السريع" في Gemini 2.0 Flash.
بالنسبة إلى Imagen، استخدِم Imagen 3. تجدر الإشارة إلى أنّ هذا النموذج متاح فقط في الخطّة المدفوعة.

يمكنك الوصول إلى كلّ من Gemini وImagen 3 باستخدام المكتبات نفسها.

إنشاء صور باستخدام Gemini

يمكن لـ Gemini إنشاء الصور ومعالجتها في إطار المحادثة. يمكنك توجيه Gemini باستخدام نص أو صور أو مزيج من الاثنين لتنفيذ مهام مختلفة متعلقة بالصور، مثل إنشاء الصور وتعديلها.

يجب تضمين responseModalities: ["TEXT", "IMAGE"] في ملف ملف الإعدادات. لا تتوفّر إمكانية عرض الصور فقط باستخدام هذه النماذج.

إنشاء الصور (التحويل من نص إلى صورة)

توضِّح التعليمة البرمجية التالية كيفية إنشاء صورة استنادًا إلى طلب وصفي:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

انتقال

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateContentConfig{
      ResponseModalities: []string{"TEXT", "IMAGE"},
  }

  result, _ := client.Models.GenerateContent(
      ctx,
      "gemini-2.0-flash-preview-image-generation",
      genai.Text("Hi, can you create a 3d rendered image of a pig " +
                 "with wings and a top hat flying over a happy " +
                 "futuristic scifi city with lots of greenery?"),
      config,
  )

  for _, part := range result.Candidates[0].Content.Parts {
      if part.Text != "" {
          fmt.Println(part.Text)
      } else if part.InlineData != nil {
          imageBytes := part.InlineData.Data
          outputFilename := "gemini_generated_image.png"
          _ = os.WriteFile(outputFilename, imageBytes, 0644)
      }
  }
}

REST

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png

صورة من إنشاء الذكاء الاصطناعي لخنزير طائر خيالي

تعديل الصور (تحويل النص والصورة إلى صورة)

لإجراء تعديل على الصورة، أضِف صورة كمدخل. يوضّح المثال التاليتحميل صور بترميز base64. بالنسبة إلى الصور المتعدّدة وحمولات العميل الأكبر حجمًا، راجِع قسم إدخال الصور.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

انتقال

package main

import (
 "context"
 "fmt"
 "os"
 "google.golang.org/genai"
)

func main() {

 ctx := context.Background()
 client, _ := genai.NewClient(ctx, &genai.ClientConfig{
     APIKey:  os.Getenv("GEMINI_API_KEY"),
     Backend: genai.BackendGeminiAPI,
 })

 imagePath := "/path/to/image.png"
 imgData, _ := os.ReadFile(imagePath)

 parts := []*genai.Part{
   genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
   &genai.Part{
     InlineData: &genai.Blob{
       MIMEType: "image/png",
       Data:     imgData,
     },
   },
 }

 contents := []*genai.Content{
   genai.NewContentFromParts(parts, genai.RoleUser),
 }

 config := &genai.GenerateContentConfig{
     ResponseModalities: []string{"TEXT", "IMAGE"},
 }

 result, _ := client.Models.GenerateContent(
     ctx,
     "gemini-2.0-flash-preview-image-generation",
     contents,
     config,
 )

 for _, part := range result.Candidates[0].Content.Parts {
     if part.Text != "" {
         fmt.Println(part.Text)
     } else if part.InlineData != nil {
         imageBytes := part.InlineData.Data
         outputFilename := "gemini_generated_image.png"
         _ = os.WriteFile(outputFilename, imageBytes, 0644)
     }
 }
}

REST

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

أوضاع إنشاء الصور الأخرى

تتيح ميزة Gemini أوضاع تفاعل أخرى مع الصور استنادًا إلى بنية الطلب و سياقه، بما في ذلك:

النص إلى صور ونصوص (متداخلة): لإنشاء صور تتضمّن نصًا ذا صلة
- مثال على طلب: "أريد إنشاء وصفة مُوضَّحة لتحضير طبق البايلا".
تحويل الصور والنصوص إلى صور ونصوص (متداخلة): يستخدم هذا الخيار الصور والنصوص التي يتم إدخالها لإنشاء صور ونصوص جديدة ذات صلة.
- مثال على طلب: (مع صورة لغرفة مفروشة) "ما هي الألوان الأخرى للأرائك التي تناسب مساحتي؟ هل يمكنك تعديل الصورة؟"
تعديل الصور في محادثات متعددة (الدردشة): يمكنك مواصلة إنشاء الصور أو تعديلها في محادثة.
- أمثلة على الطلبات: [upload an image of a blue car.] ‎"أريد تحويل هذه السيارة إلى سيارة قابلة للتحويل".، "الآن، غيِّر اللون إلى الأصفر".

القيود

للحصول على أفضل أداء، استخدِم اللغات التالية: EN وes-MX وja-JP وzh-CN و hi-IN.
لا تتيح ميزة إنشاء الصور إدخالات صوتية أو فيديوهات.
قد لا يتم إنشاء الصور في الحالات التالية:
- قد يعرض النموذج نصًا فقط. جرِّب طلب نتائج الصور صراحةً (مثل "إنشاء صورة" أو "تقديم صور أثناء الإجراء" أو "تعديل الصورة").
- قد يتوقف النموذج عن إنشاء المحتوى في منتصف العملية. يُرجى إعادة المحاولة أو استخدام طلب مختلف.
عند إنشاء نص لصورة، يعمل Gemini بشكل أفضل إذا أنشأت أولاً النص ثم طلبت صورة تتضمّن النص.
لا تتوفّر ميزة "إنشاء الصور" في بعض المناطق أو البُلدان. يمكنك الاطّلاع على النماذج للحصول على مزيد من المعلومات.

إنشاء صور باستخدام Imagen 3

يوضّح هذا المثال إنشاء صور باستخدام Imagen 3:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

انتقال

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-3.0-generate-002",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

صورة من إنشاء الذكاء الاصطناعي لروبوت يحمل لوح تزلج أحمر — صورة من إنشاء الذكاء الاصطناعي لروبوتات يحمل لوح تزلج أحمر

مَعلمات نموذج Imagen

تتيح Imagen الطلبات باللغة الإنجليزية فقط في الوقت الحالي والمَعلمات التالية:

‫numberOfImages: عدد الصور المطلوب إنشاؤها، من 1 إلى 4 (شاملة). القيمة التلقائية هي 4.
aspectRatio: لتغيير نسبة العرض إلى الارتفاع للصورة التي تم إنشاؤها القيم المتوافقة هي "1:1" و"3:4" و"4:3" و"9:16" و"16:9". القيمة التلقائية هي "1:1".
personGeneration: اسمح للنموذج بإنشاء صور لأشخاص. في ما يلي القيم المتوافقة:
- "DONT_ALLOW": حظر إنشاء صور للأشخاص
- "ALLOW_ADULT": إنشاء صور لأشخاص بالغين، ولكن ليس للأطفال هذا هو الخيار التلقائي.

اختيار النموذج المناسب

اختَر Gemini في الحالات التالية:

يجب أن تكون الصور ذات صلة بالسياق وتستفيد من المعرفة والتفكير العالميين.
من المهم دمج النصوص والصور بسلاسة.
إذا كنت تريد تضمين مرئيات دقيقة في تسلسلات نصية طويلة
إذا كنت تريد تعديل الصور بشكل تفاعلي مع الحفاظ على السياق

اختَر Imagen 3 في الحالات التالية:

إنّ جودة الصورة أو الواقعية الفوتوغرافية أو التفاصيل الفنية أو الأنماط المحدّدة (مثل الانطباعية والأنمي) هي أهم الأولويات.
تنفيذ مهام تعديل مخصّصة، مثل تعديل خلفية المنتج أو زيادة كثافة بكسل الصور
دمج العلامة التجارية أو الأسلوب أو إنشاء الشعارات وتصاميم المنتجات

دليل طلبات Imagen

يوضّح لك هذا القسم من دليل Imagen كيفية تعديل طلب تحويل النص إلى صورة لتحقيق نتائج مختلفة، بالإضافة إلى أمثلة على الصور التي يمكنك إنشاؤها.

أساسيات كتابة الطلبات

يكون الطلب الجيد وصفيًا وواضحًا، ويستخدم كلمات رئيسية و مُعدِّلات ذات مغزى. ابدأ بالتفكير في الموضوع والسياق والأسلوب.

طلب يُبرز الموضوع والسياق والأسلوب — نص الصورة: *رسم* (**الأسلوب**) *لمبنى سكني حديث* (**الموضوع**) محاط *بناطحات سحاب* (**السياق والخلفية**).

الموضوع: أول ما يجب التفكير فيه عند استخدام أي طلب هو الموضوع: الكائن أو الشخص أو الحيوان أو المشهد الذي تريد الحصول على صورة له.
السياق والخلفية: لا يقلّ الخلفية أو السياق الذي سيتم وضع الهدف فيه أهمية عن الهدف نفسه. جرِّب وضع الهدف في مجموعة متنوعة من الخلفيات. على سبيل المثال، استوديو بخلفية بيضاء أو أماكن خارجية أو أماكن داخلية
النمط: أخيرًا، أضِف نمط الصورة الذي تريده. يمكن أن تكون الأنماط عامة (رسم أو صورة أو رسومات تخطيطية) أو محدّدة جدًا (رسم بالألوان المائية أو رسم بالفحم أو رسم ثلاثي الأبعاد إسقاطي). يمكنك أيضًا دمج الأنماط.

بعد كتابة نسخة أولى من الطلب، يمكنك تحسينه من خلال إضافة مزيد من التفاصيل إلى أن تصل إلى الصورة التي تريدها. التكرار مهم. ابدأ بتحديد الفكرة الأساسية، ثمّ حسِّنها ووسِّعها إلى أن تصبح الصورة التي تم إنشاؤها قريبة من رؤيتك.

صورة نموذجية واقعية 1 — الطلب: حديقة في الربيع بجانب بحيرة

صورة نموذجية واقعية 2 — الوصف: حديقة في الربيع بجانب بحيرة، **تغرب الشمس على البحيرة، الساعة الذهبية**

نموذج صورة واقعية 3 — الوصف: حديقة في الربيع بجانب بحيرة، **غروب الشمس على البحيرة، ساعة الذهبية، زهور برية حمراء**

يمكن أن يحوّل تطبيق Imagen 3 أفكارك إلى صور مفصّلة، سواء كانت الطلبات قصيرة أو طويلة ومفصّلة. يمكنك تحسين رؤيتك من خلال طلبات متكرّرة، مع إضافة تفاصيل إلى أن تحصل على النتيجة المثالية.

تتيح لك الطلبات القصيرة إنشاء صورة بسرعة.

مثال على طلب قصير في Imagen 3 — الطلب: صورة مقرّبة لامرأة في العشرينات من عمرها، تصوير شارع، لقطة من فيلم، ألوان دافئة وبرتقالية باهتة

تتيح لك الطلبات الأطول إضافة تفاصيل محدّدة وإنشاء صورتك.

مثال على طلب طويل في Imagen 3 — الطلب: صورة آسرة لامرأة في العشرينات من عمرها تستخدم أسلوب تصوير في الشوارع يجب أن تبدو الصورة كصورة ثابتة من فيلم مع درجات برتقالي دافئ.

نصائح إضافية لكتابة طلبات Imagen:

استخدام لغة وصفية: استخدِم الصفات والظروف التفصيلية لشدّ انتباه المستخدمين و تقديم صورة واضحة لـ Imagen 3.
تقديم سياق: إذا لزم الأمر، يمكنك تضمين معلومات أساسية لمساعدة الذكاء الاصطناعي في فهم المحتوى.
الإشارة إلى فنّانين أو أنماط معيّنة: إذا كان لديك أسلوب جمالي معيّن في ذهنك، قد يكون من المفيد الإشارة إلى فنّانين أو حركات فنية معيّنة.
استخدام أدوات هندسة الطلبات: ننصحك باستكشاف أدوات أو موارد هندسة الطلبات لمساعدتك في تحسين طلباتك وتحقيق أفضل النتائج.
تحسين تفاصيل الوجه في الصور الشخصية والجماعية: حدِّد تفاصيل الوجه كعنصر رئيسي في الصورة (على سبيل المثال، استخدِم الكلمة "بورتريه" في الطلب).

إنشاء نص في الصور

يمكن أن تضيف Imagen نصًا إلى الصور، ما يفتح المزيد من احتمالات إنشاء صور مبتكرة. اتّبِع الإرشادات التالية للاستفادة إلى أقصى حدّ من هذه الميزة:

تكرار الخطوات بثقة: قد تحتاج إلى إعادة إنشاء الصور إلى أن تتمكّن من تحقيق المظهر الذي تريده. لا تزال عملية دمج النصوص في Imagen في مرحلة التطور، وفي بعض الأحيان تؤدي المحاولات المتعدّدة إلى تحقيق أفضل النتائج.
اختصار النص: يجب أن يتألف النص من 25 حرفًا أو أقل لضمان OPTIMAL الإنشاء.
عبارات متعددة: جرِّب عبارةَين أو ثلاث عبارات مختلفة لتوفير معلومات إضافية. تجنَّب استخدام أكثر من ثلاث عبارات لإنشاء تركيبات تصاميم أنظف.

الطلب: ملصق يتضمّن النص "Summerland" بخط عريض كه عنوان ، وتحت هذا النص يظهر الشعار "Summer never felt so good"
توجيه مواضع النص: على الرغم من أنّ Imagen يمكن أن تحاول وضع النص على النحو المُوجَّه، توقّع حدوث اختلافات من حين لآخر. نحن نعمل باستمرار على تحسين هذه الميزة.
نمط الخط المستوحى: حدِّد نمط خط عام للتأثير بشكلٍ دقيق في خيارات Imagen. لا تعتمد على تكرار الخط بدقة، ولكن توقّع تفسيرات إبداعية.
حجم الخط: حدِّد حجم خط أو إشارة عامة إلى الحجم (مثل صغير أو متوسط أو كبير) للتأثير في عملية إنشاء حجم الخط.

إعداد مَعلمات الطلب

للتحكّم بشكل أفضل في نتائج الإخراج، قد يكون من المفيد وضع مَعلمات للمدخلات في Imagen. على سبيل المثال، لنفترض أنّك تريد أن يتمكّن عملاؤك من إنشاء شعارات لنشاطاتهم التجارية، و تريد التأكّد من إنشاء الشعارات دائمًا على خلفية بلون واحد. وبإمكانك أيضًا تحديد الخيارات التي يمكن للعميل اختيارها من القائمة.

في هذا المثال، يمكنك إنشاء طلب مُحدَّد بالمَعلمات مشابهًا للطلب التالي:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

في واجهة المستخدم المخصّصة، يمكن للعميل إدخال المَعلمات باستخدام قائمة، وتعبِّئ القيمة التي يختارها الطلب الذي تتلقّاه Imagen.

على سبيل المثال:

الطلب: A minimalist logo for a health care company on a solid color background. Include the text Journey.
الطلب: A modern logo for a software company on a solid color background. Include the text Silo.
الطلب: A traditional logo for a baking company on a solid color background. Include the text Seed.

أساليب كتابة الطلبات المتقدّمة

استخدِم الأمثلة التالية لإنشاء طلبات أكثر تحديدًا استنادًا إلى السمات، مثل أوصاف الصور الفوتوغرافية والأشكال والمواد وحركات الفن التاريخي وعوامل تعديل جودة الصورة.

التصوير الفوتوغرافي

تتضمّن الرسالة المطالبة ما يلي: "صورة..."

لاستخدام هذا النمط، ابدأ باستخدام كلمات رئيسية تُعلم Imagen بوضوح أنّك تبحث عن صورة فوتوغرافية. ابدأ طلباتك بعبارة "صورة لـ . ‎.". على سبيل المثال:

^{مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.}

عناصر تعديل الصور

في الأمثلة التالية، يمكنك الاطّلاع على العديد من المُعدِّلات والمَعلمات المتعلّقة بالتصوير الفوتوغرافي. يمكنك الجمع بين عدّة عوامل تعديل للتحكّم بشكل أدق.

قرب الكاميرا: صورة مقرّبة تم التقاطها من مسافة بعيدة

نموذج صورة من الكاميرا المقرّبة — الطلب: صورة **مقرّبة** لحبوب القهوة

صورة نموذجية للكاميرا بعد التصغير — الطلب: صورة **مكبّرة** لحقيبة صغيرة من
حبوب القهوة في مطبخ فوضوي

موضع الكاميرا: من الجو، من الأسفل

نموذج صورة جوية — الطلب: **صورة من الجو** لمدينة حضرية بها ناطحات سحاب

صورة نموذجية من الأسفل — الطلب: صورة لظلة غابة مع سماء زرقاء **من الأسفل**

الإضاءة: طبيعية، مميّزة، دافئة، باردة

صورة نموذجية للإضاءة الطبيعية — الطلب: صورة استوديو لكرسي بذراعَين حديث، **بإضاءة طبيعية**

صورة نموذجية للإضاءة القوية — الطلب: صورة استوديو لكرسي بذراعَين حديث، **بإضاءة درامية**

إعدادات الكاميرا - تمويه الحركة والتركيز الناعم والتأثير البؤري ووضع "بورتريه"

نموذج صورة تمويه الصورة المتحركة — الطلب: صورة لمدينة بها ناطحات سحاب من داخل سيارة مع **تمويه الحركة**

نموذج صورة بتركيز ضعيف — الطلب: صورة **بتركيز خفيف** لجسر في مدينة حضرية ليلاً

أنواع العدسات: 35 ملم و50 ملم وعدسة عين السمكة وعدسة بزاوية واسعة وعدسة الماكرو

نموذج صورة تم التقاطها باستخدام عدسة الماكرو — الطلب: صورة لورقة شجر، **عدسة مقرّبة**

نموذج صورة عدسة عين السمكة — الطلب: تصوير الشوارع، مدينة نيويورك، **عدسة عين السمكة**

أنواع الأفلام: أبيض وأسود، بولارويد

صورة نموذجية لصورة بولارويد — الطلب: **صورة بانورامية** لكلب يرتدي نظّارات شمسية

صورة نموذجية لصورة بالأبيض والأسود — الطلب: **صورة بالأبيض والأسود** لكلب يرتدي نظّارات شمسية

^{مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.}

الرسوم التوضيحية والفنون

تتضمّن الرسالة المطالبة: "painting من..."، "sketch من..."

تتنوع أنماط الأعمال الفنية من الأنماط أحادية اللون، مثل الرسومات بالقلم الرصاص، إلى الفن الرقمي الفائق الواقعية. على سبيل المثال، تستخدم الصور التالية الطلب نفسه بأسلوبين مختلفين:

"[art style or creation technique] لسيارة كهربائية رياضية ملفتة للعيان بتصميم مستقيم مع ناطحات سحاب في الخلفية"

صور نموذجية للأعمال الفنية — الطلب: **رسم فني بقلم الرصاص** لشكل...

^{مصدر الصور: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 2.}

الأشكال والمواد

تتضمّن الرسالة المطالبة: "...مصنوعة من..."، "...في شكل..."

من نقاط قوة هذه التكنولوجيا أنّه يمكنك إنشاء صور يصعب أو يستحيل الحصول عليها بغير هذه الطريقة. على سبيل المثال، يمكنك إعادة إنشاء شعار شركتك باستخدام مواد وأشكال مختلفة.

مثال 1 على الصور التي تعرض الأشكال والمواد — الطلب: حقيبة رياضية كبيرة **مصنوعة من** الجبن

مثال 2 على الصور التي تعرض الأشكال والمواد — الطلب: أنابيب نيون **على شكل** طائر

مثال على صورة الأشكال والمواد 3 — الطلب: صورة استوديو لكرسي بذراعين **مصنوع من الورق** بأسلوب أوريغامي

^{مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.}

مراجع الفنّ التاريخي

تتضمّن الرسالة المطالبة ما يلي: "...بأسلوب..."

وقد أصبحت بعض الأنماط رمزية على مرّ السنين. في ما يلي بعض الأفكار عن الرسم أو الأساليب الفنية التاريخية التي يمكنك تجربتها.

"إنشاء صورة بأسلوب [art period or movement]: مزرعة رياح"

مثال لصورة فنية بالأسلوب الانطباعي — الطلب: إنشاء صورة بأسلوب *لوحة انطباعية*: مزرعة رياح

مثال على صورة من عصر النهضة — الطلب: أنشئ صورة بأسلوب *لوحة من عصر النهضة*: مزرعة رياح

مثال على صورة فن البوب — الطلب: إنشاء صورة بأسلوب *فن البوب*: مزرعة رياح

^{مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.}

عوامل تعديل جودة الصورة

يمكن أن تُعلم كلمات رئيسية معيّنة النموذج بأنّك تبحث عن مادة عرض عالية الجودة. تشمل أمثلة عوامل تعديل الجودة ما يلي:

العناصر المعدِّلة العامة: عالية الجودة وجميلة وذات تصميم فني
الصور: 4K وHDR و"صور الاستوديو"
الأعمال الفنية والرسوم التوضيحية: من إعداد فنان محترف ومفصّل

في ما يلي بعض الأمثلة على الطلبات بدون عوامل تعديل الجودة والطلب نفسه مع عوامل تعديل الجودة.

مثال على صورة ذرة بدون عوامل تعديل — الطلب (بدون عوامل تعديل الجودة): صورة لساقه ذرة

مثال لصورة ذرة تتضمّن مُعدِّلات — الطلب (مع عوامل تعديل الجودة): **صورة جميلة بدقة 4K بنطاق عالي الديناميكية**
لساقه ذرة التقطها
مصور فوتوغرافي محترف

^{مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.}

نِسب العرض إلى الارتفاع

تتيح لك ميزة إنشاء الصور في Imagen 3 ضبط خمس نسب عرض إلى ارتفاع مختلفة للصور.

مربّعة (1:1، الإعداد التلقائي) - صورة مربّعة عادية. تشمل الاستخدامات الشائعة لهذه التناسب المشاركات على وسائل التواصل الاجتماعي.

ملء الشاشة (4:3): تُستخدَم نسبة العرض إلى الارتفاع هذه بشكل شائع في الوسائط أو الأفلام. وهي أيضًا أبعاد معظم أجهزة التلفزيون القديمة (غير ذات الشاشة العريضة) والكاميرات ذات التنسيق المتوسط. وتلتقط هذه النسبة المزيد من المشهد أفقيًا (مقارنةً بنسبة 1:1)، ما يجعلها نسبة العرض إلى الارتفاع المفضّلة للتصوير الفوتوغرافي.

مثال على نسبة العرض إلى الارتفاع — الطلب: لقطة مقرّبة لأصابع موسيقي وهو يعزف على البيانو، فيلم أبيض وأسود قديم (نسبة عرض إلى ارتفاع 4:3)

ملء الشاشة في الوضع العمودي (3:4): هذه هي نسبة العرض إلى الارتفاع في وضع ملء الشاشة بعد تدويرها 90 درجة. يتيح لك ذلك التقاط المزيد من المشهد بشكل عمودي مقارنةً بنسبة العرض إلى الارتفاع التي تبلغ 1:1.

شاشة عريضة (16:9): حلّت هذه النسبة محلّ نسبة 4:3، وهي الآن نسبة العرض إلى الارتفاع الأكثر شيوعًا لأجهزة التلفزيون والشاشات وشاشات الهواتف الجوّالة (أفقية). استخدِم نسبة العرض إلى الارتفاع هذه عندما تريد تصوير المزيد من الخلفية (مثلاً، المناظر الطبيعية).

الطلب: رجل يرتدي ملابس بيضاء بالكامل ويجلس على الشاطئ، لقطة مقرّبة، إضاءة "ساعة الذهبية" (نسبة عرض إلى ارتفاع 16:9)
عمودي (9:16): هذه نسبة شاشة عريضة ولكن تم تدويرها. هذه نسبة عرض إلى ارتفاع جديدة نسبيًا اشتهرت من خلال تطبيقات الفيديوهات القصيرة (مثل YouTube Shorts). استخدِم هذا الخيار للكائنات الطويلة ذات الاتجاهات العمودية القوية، مثل المباني أو الأشجار أو الشلالات أو غيرها من الكائنات المشابهة.

المطلوب: صورة رقمية لساعة ناطحة سحاب ضخمة، حديثة، فخمة، ملحمية مع غروب جميل في الخلفية (نسبة العرض إلى الارتفاع 9:16)

الصور الواقعية

قد توفّر الإصدارات المختلفة من نموذج إنشاء الصور مزيجًا من النتائج الفنية والواقعية. استخدِم العبارة التالية في الطلبات لإنشاء نتائج أكثر واقعية، استنادًا إلى الموضوع الذي تريد إنشاؤه.

حالة الاستخدام	نوع العدسة	الأبعاد البؤرية	تفاصيل إضافية
الأشخاص (صور الأشخاص)	تحسين الصورة، التكبير/التصغير	24-35 مم	فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين)
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة)	وحدة الماكرو	60-105 مم	تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم
الرياضة والحياة البرية (متحرك)	التكبير/التصغير باستخدام العدسة المقرّبة	100-400 مم	سرعة غالق سريعة أو تتبُّع الحركة أو الحدث
صور فلكية، أفقية (بزاوية واسعة)	زاوية عريضة	10-24 مم	أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة

صور شخصية

حالة الاستخدام	نوع العدسة	الأبعاد البؤرية	تفاصيل إضافية
الأشخاص (صور الأشخاص)	تحسين الصورة، التكبير/التصغير	24-35 مم	فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين)

باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء ملفّات بورتريه التالية:

الطلب: صورة امرأة بالوضع العمودي بتنسيق 35 مم بلونين أزرق ورمادي
الطراز: imagen-3.0-generate-002

الطلب: صورة امرأة بالأبيض والأسود مقاس 35 مم، فيلم نوار
النموذج: imagen-3.0-generate-002

العناصر

حالة الاستخدام	نوع العدسة	الأبعاد البؤرية	تفاصيل إضافية
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة)	وحدة الماكرو	60-105 مم	تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم

باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء صور الأجسام التالية:

الطلب: ورقة نبات دعاء، عدسة مقرّبة، 60 مم
النموذج: imagen-3.0-generate-002

الطلب: طبق معكرونة، عدسة ماكرو بدقة 100 مم
النموذج: imagen-3.0-generate-002

الحركة

حالة الاستخدام	نوع العدسة	الأبعاد البؤرية	تفاصيل إضافية
الرياضة والحياة البرية (متحرك)	التكبير/التصغير باستخدام العدسة المقرّبة	100-400 مم	سرعة غالق سريعة أو تتبُّع الحركة أو الحدث

باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور المتحركة التالية:

الطلب: هدف الفوز، سرعة غالق سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002

الطلب: غزال يركض في الغابة، سرعة التقاط سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002

زاوية عريضة

حالة الاستخدام	نوع العدسة	الأبعاد البؤرية	تفاصيل إضافية
صور فلكية، أفقية (بزاوية واسعة)	زاوية عريضة	10-24 مم	أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة

باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور التالية بزاوية واسعة:

الطلب: سلسلة جبلية شاسعة، زاوية عريضة أفقية 10 مم
النموذج: imagen-3.0-generate-002

الطلب: صورة للقمر، تصوير فلكي، زاوية واسعة 10 مم
طراز الجهاز: imagen-3.0-generate-002

الخطوات التالية

اطّلِع على دليل Veo للتعرّف على كيفية إنشاء الفيديوهات باستخدام Gemini API.
لمزيد من المعلومات عن نماذج Gemini 2.0، اطّلِع على نماذج Gemini والنماذج التجريبية.