با Veo 3.1 در Gemini API ویدیو ایجاد کنید

Veo 3.1 مدل پیشرفته گوگل برای تولید ویدیوهای 8 ثانیه‌ای با کیفیت 720p یا 1080p با وضوح بالا و واقع‌گرایی خیره‌کننده و صدای تولید شده بومی است. می‌توانید با استفاده از Gemini API به صورت برنامه‌نویسی شده به این مدل دسترسی پیدا کنید. برای کسب اطلاعات بیشتر در مورد انواع مدل‌های Veo موجود، به بخش نسخه‌های مدل مراجعه کنید.

Veo 3.1 در طیف گسترده‌ای از سبک‌های بصری و سینمایی برتری دارد و چندین قابلیت جدید را معرفی می‌کند:

  • افزونه ویدیو : ویدیوهایی را که قبلاً با استفاده از Veo تولید شده بودند، گسترش دهید.
  • تولید فریم خاص : با مشخص کردن اولین و آخرین فریم، یک ویدیو تولید کنید.
  • جهت‌دهی مبتنی بر تصویر : از حداکثر سه تصویر مرجع برای هدایت محتوای ویدیوی تولید شده خود استفاده کنید.

برای اطلاعات بیشتر در مورد نوشتن متن‌های پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.

تولید متن به ویدیو

برای دیدن نحوه تولید ویدیو با دیالوگ، رئالیسم سینمایی یا انیمیشن خلاقانه، یک مثال را انتخاب کنید:

پایتون

import time
from google import genai
from google.genai import types

client = genai.Client()

prompt = """A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'"""

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the generated video.
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("dialogue_example.mp4")
print("Generated video saved to dialogue_example.mp4")

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const prompt = `A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'`;

let operation = await ai.models.generateVideos({
    model: "veo-3.1-generate-preview",
    prompt: prompt,
});

// Poll the operation status until the video is ready.
while (!operation.done) {
    console.log("Waiting for video generation to complete...")
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
        operation: operation,
    });
}

// Download the generated video.
ai.files.download({
    file: operation.response.generatedVideos[0].video,
    downloadPath: "dialogue_example.mp4",
});
console.log(`Generated video saved to dialogue_example.mp4`);

برو

package main

import (
    "context"
    "log"
    "os"
    "time"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }

    prompt := `A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
    A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'`

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-3.1-generate-preview",
        prompt,
        nil,
        nil,
    )

    // Poll the operation status until the video is ready.
    for !operation.Done {
    log.Println("Waiting for video generation to complete...")
        time.Sleep(10 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    // Download the generated video.
    video := operation.Response.GeneratedVideos[0]
    client.Files.Download(ctx, video.Video, nil)
    fname := "dialogue_example.mp4"
    _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    log.Printf("Generated video saved to %s\n", fname)
}

استراحت

# Note: This script uses jq to parse the JSON response.
# GEMINI API Base URL
BASE_URL="https://generativelanguage.googleapis.com/v1beta"

# Send request to generate video and capture the operation name into a variable.
operation_name=$(curl -s "${BASE_URL}/models/veo-3.1-generate-preview:predictLongRunning" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "A close up of two people staring at a cryptic drawing on a wall, torchlight flickering. A man murmurs, \"This must be it. That'\''s the secret code.\" The woman looks at him and whispering excitedly, \"What did you find?\""
      }
    ]
  }' | jq -r .name)

# Poll the operation status until the video is ready
while true; do
  # Get the full JSON status and store it in a variable.
  status_response=$(curl -s -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${operation_name}")

  # Check the "done" field from the JSON stored in the variable.
  is_done=$(echo "${status_response}" | jq .done)

  if [ "${is_done}" = "true" ]; then
    # Extract the download URI from the final response.
    video_uri=$(echo "${status_response}" | jq -r '.response.generateVideoResponse.generatedSamples[0].video.uri')
    echo "Downloading video from: ${video_uri}"

    # Download the video using the URI and API key and follow redirects.
    curl -L -o dialogue_example.mp4 -H "x-goog-api-key: $GEMINI_API_KEY" "${video_uri}"
    break
  fi
  # Wait for 5 seconds before checking again.
  sleep 10
done

تولید تصویر به ویدیو

کد زیر تولید یک تصویر با استفاده از Gemini 2.5 Flash Image یا همان Nano Banana را نشان می‌دهد، سپس از آن تصویر به عنوان فریم شروع برای تولید ویدیو با Veo 3.1 استفاده می‌کند.

پایتون

import time
from google import genai

client = genai.Client()

prompt = "Panning wide shot of a calico kitten sleeping in the sunshine"

# Step 1: Generate an image with Nano Banana.
image = client.models.generate_content(
    model="gemini-2.5-flash-image",
    prompt=prompt,
)

# Step 2: Generate video with Veo 3.1 using the image.
operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
    image=image.generated_images[0].image,
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3_with_image_input.mp4")
print("Generated video saved to veo3_with_image_input.mp4")

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const prompt = "Panning wide shot of a calico kitten sleeping in the sunshine";

// Step 1: Generate an image with Nano Banana.
const imageResponse = await ai.models.generateContent({
  model: "gemini-2.5-flash-image",
  prompt: prompt,
});

// Step 2: Generate video with Veo 3.1 using the image.
let operation = await ai.models.generateVideos({
  model: "veo-3.1-generate-preview",
  prompt: prompt,
  image: {
    imageBytes: imageResponse.generatedImages[0].image.imageBytes,
    mimeType: "image/png",
  },
});

// Poll the operation status until the video is ready.
while (!operation.done) {
  console.log("Waiting for video generation to complete...")
  await new Promise((resolve) => setTimeout(resolve, 10000));
  operation = await ai.operations.getVideosOperation({
    operation: operation,
  });
}

// Download the video.
ai.files.download({
    file: operation.response.generatedVideos[0].video,
    downloadPath: "veo3_with_image_input.mp4",
});
console.log(`Generated video saved to veo3_with_image_input.mp4`);

برو

package main

import (
    "context"
    "log"
    "os"
    "time"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }

    prompt := "Panning wide shot of a calico kitten sleeping in the sunshine"

    // Step 1: Generate an image with Nano Banana.
    imageResponse, err := client.Models.GenerateContent(
        ctx,
        "gemini-2.5-flash-image",
        prompt,
        nil, // GenerateImagesConfig
    )
    if err != nil {
        log.Fatal(err)
    }

    // Step 2: Generate video with Veo 3.1 using the image.
    operation, err := client.Models.GenerateVideos(
        ctx,
        "veo-3.1-generate-preview",
        prompt,
        imageResponse.GeneratedImages[0].Image,
        nil, // GenerateVideosConfig
    )
    if err != nil {
        log.Fatal(err)
    }

    // Poll the operation status until the video is ready.
    for !operation.Done {
        log.Println("Waiting for video generation to complete...")
        time.Sleep(10 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    // Download the video.
    video := operation.Response.GeneratedVideos[0]
    client.Files.Download(ctx, video.Video, nil)
    fname := "veo3_with_image_input.mp4"
    _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    log.Printf("Generated video saved to %s\n", fname)
}

استفاده از تصاویر مرجع

Veo 3.1 اکنون حداکثر ۳ تصویر مرجع را برای هدایت محتوای ویدیوی تولید شده شما می‌پذیرد. تصاویری از یک شخص، شخصیت یا محصول را ارائه دهید تا ظاهر سوژه در ویدیوی خروجی حفظ شود.

برای مثال، با استفاده از این سه تصویر تولید شده با نانو موز به عنوان مرجع و یک دستورالعمل خوب نوشته شده، ویدیوی زیر ایجاد می‌شود:

`dress_image` `woman_image` `glasses_image`
لباس فلامینگوی شیک با لایه‌هایی از پرهای صورتی و بنفشزن زیبا با موهای تیره و چشمان قهوه‌ای گرمعینک آفتابی فانتزی به شکل قلب و صورتی

پایتون

import time
from google import genai

client = genai.Client()

prompt = "The video opens with a medium, eye-level shot of a beautiful woman with dark hair and warm brown eyes. She wears a magnificent, high-fashion flamingo dress with layers of pink and fuchsia feathers, complemented by whimsical pink, heart-shaped sunglasses. She walks with serene confidence through the crystal-clear, shallow turquoise water of a sun-drenched lagoon. The camera slowly pulls back to a medium-wide shot, revealing the breathtaking scene as the dress's long train glides and floats gracefully on the water's surface behind her. The cinematic, dreamlike atmosphere is enhanced by the vibrant colors of the dress against the serene, minimalist landscape, capturing a moment of pure elegance and high-fashion fantasy."

dress_reference = types.VideoGenerationReferenceImage(
  image=dress_image, # Generated separately with Nano Banana
  reference_type="asset"
)

sunglasses_reference = types.VideoGenerationReferenceImage(
  image=glasses_image, # Generated separately with Nano Banana
  reference_type="asset"
)

woman_reference = types.VideoGenerationReferenceImage(
  image=woman_image, # Generated separately with Nano Banana
  reference_type="asset"
)

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
    config=types.GenerateVideosConfig(
      reference_images=[dress_reference, glasses_reference, woman_reference],
    ),
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_with_reference_images.mp4")
print("Generated video saved to veo3.1_with_reference_images.mp4")

استفاده از فریم‌های اول و آخر

Veo 3.1 به شما امکان می‌دهد با استفاده از درون‌یابی یا مشخص کردن اولین و آخرین فریم‌های ویدیو، ویدیو ایجاد کنید. برای اطلاعات بیشتر در مورد نوشتن متن‌های پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.

پایتون

import time
from google import genai

client = genai.Client()

prompt = "A cinematic, haunting video. A ghostly woman with long white hair and a flowing dress swings gently on a rope swing beneath a massive, gnarled tree in a foggy, moonlit clearing. The fog thickens and swirls around her, and she slowly fades away, vanishing completely. The empty swing is left swaying rhythmically on its own in the eerie silence."

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt=prompt,
    image=first_image, # Generated separately with Nano Banana
    config=types.GenerateVideosConfig(
      last_frame=last_image # Generated separately with Nano Banana
    ),
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_with_interpolation.mp4")
print("Generated video saved to veo3.1_with_interpolation.mp4")
`first_image` `last_image` veo3.1_with_interpolation.mp4
زنی شبح‌مانند با موهای بلند سفید و لباسی گشاد، به آرامی روی طناب تاب می‌خوردزن شبح مانند از روی تاب ناپدید می‌شودویدئویی سینمایی و دلهره‌آور از ناپدید شدن زنی وهم‌آلود از تاب در مه

گسترش ویدیوهای Veo

از Veo 3.1 برای افزایش طول ویدیوهایی که قبلاً با Veo تولید کرده‌اید، به میزان ۷ ثانیه و تا ۲۰ برابر استفاده کنید.

محدودیت‌های ویدیوی ورودی:

  • ویدیوهای تولید شده توسط وئو فقط تا ۱۴۱ ثانیه.
  • رابط برنامه‌نویسی نرم‌افزار Gemini فقط از افزونه‌های ویدیویی برای ویدیوهای تولید شده توسط Veo پشتیبانی می‌کند.
  • انتظار می‌رود ویدیوهای ورودی طول، نسبت ابعاد و ابعاد مشخصی داشته باشند:
    • نسبت تصویر: ۹:۱۶ یا ۱۶:۹
    • وضوح تصویر: ۷۲۰p
    • طول ویدیو: ۱۴۱ ثانیه یا کمتر

خروجی این افزونه یک ویدیوی واحد است که از ترکیب ویدیوی ورودی کاربر و ویدیوی توسعه‌یافته‌ی تولید شده تا سقف ۱۴۸ ثانیه ساخته شده است.

این مثال، ویدیوی butterfly_video تولید شده توسط Veo را که در اینجا با اعلان اصلی آن نشان داده شده است، می‌گیرد و آن را با استفاده از پارامتر video و یک اعلان جدید، گسترش می‌دهد:

سریع خروجی: butterfly_video
یک پروانه اوریگامی بال‌هایش را به هم می‌زند و از درهای فرانسوی به داخل باغ پرواز می‌کند. پروانه اوریگامی بال‌هایش را به هم می‌زند و از درهای فرانسوی به داخل باغ پرواز می‌کند.

پایتون

import time
from google import genai

client = genai.Client()

prompt = "Track the butterfly into the garden as it lands on an orange origami flower. A fluffy white puppy runs up and gently pats the flower."

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    video=butterfly_video,
    prompt=prompt,
    config=types.GenerateVideosConfig(
        number_of_videos=1,
        resolution="720p"
    ),
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_extension.mp4")
print("Generated video saved to veo3.1_extension.mp4")

برای اطلاعات در مورد نوشتن متن‌های پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.

مدیریت عملیات ناهمزمان

تولید ویدیو یک کار محاسباتی فشرده است. وقتی درخواستی را به API ارسال می‌کنید، یک کار طولانی مدت را شروع می‌کند و بلافاصله یک شیء operation را برمی‌گرداند. سپس باید تا زمانی که ویدیو آماده شود، نظرسنجی کنید، که با وضعیت done درست نشان داده می‌شود.

هسته اصلی این فرآیند یک حلقه نظرسنجی است که به صورت دوره‌ای وضعیت کار را بررسی می‌کند.

پایتون

import time
from google import genai
from google.genai import types

client = genai.Client()

# After starting the job, you get an operation object.
operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="A cinematic shot of a majestic lion in the savannah.",
)

# Alternatively, you can use operation.name to get the operation.
operation = types.GenerateVideosOperation(name=operation.name)

# This loop checks the job status every 10 seconds.
while not operation.done:
    time.sleep(10)
    # Refresh the operation object to get the latest status.
    operation = client.operations.get(operation)

# Once done, the result is in operation.response.
# ... process and download your video ...

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

// After starting the job, you get an operation object.
let operation = await ai.models.generateVideos({
  model: "veo-3.1-generate-preview",
  prompt: "A cinematic shot of a majestic lion in the savannah.",
});

// Alternatively, you can use operation.name to get the operation.
// operation = types.GenerateVideosOperation(name=operation.name)

// This loop checks the job status every 10 seconds.
while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 1000));
    // Refresh the operation object to get the latest status.
    operation = await ai.operations.getVideosOperation({ operation });
}

// Once done, the result is in operation.response.
// ... process and download your video ...

پارامترها و مشخصات API Veo

اینها پارامترهایی هستند که می‌توانید در درخواست API خود برای کنترل فرآیند تولید ویدیو تنظیم کنید.

پارامتر توضیحات ویو ۳.۱ و ویو ۳.۱ سریع ویو ۳ و ویو ۳ فست وئو ۲
prompt توضیحات متنی برای ویدیو. پشتیبانی از نشانه‌های صوتی. string string string
negativePrompt متنی که توضیح می‌دهد چه چیزهایی را نباید در ویدیو بگنجانید. string string string
image یک تصویر اولیه برای متحرک‌سازی. شیء Image شیء Image شیء Image
lastFrame تصویر نهایی برای انتقال ویدیوی درون‌یابی. باید در ترکیب با پارامتر image استفاده شود. شیء Image شیء Image شیء Image
referenceImages حداکثر سه تصویر به عنوان مرجع سبک و محتوا استفاده شود. شیء VideoGenerationReferenceImage (فقط در نسخه 3.1) ناموجود ناموجود
video ویدیویی که قرار است برای افزونه ویدیویی استفاده شود. شیء Video ناموجود ناموجود
aspectRatio نسبت ابعاد ویدیو. "16:9" (پیش‌فرض، ۷۲۰p و ۱۰۸۰p)،
"9:16" (۷۲۰p و ۱۰۸۰p)

"16:9" (پیش‌فرض، ۷۲۰p و ۱۰۸۰p)،
"9:16" (۷۲۰p و ۱۰۸۰p)
"16:9" (پیش‌فرض، ۷۲۰p)،
"9:16" (۷۲۰p)
resolution نسبت ابعاد ویدیو. "720p" (پیش‌فرض)،
"1080p" (فقط از مدت زمان ۸ ثانیه پشتیبانی می‌کند)

"720p" فقط برای افزونه
"720p" (پیش‌فرض)،
"1080p" (فقط ۱۶:۹)
پشتیبانی نشده
durationSeconds مدت زمان ویدیوی تولید شده. "4" ، "6" ، "8" .

هنگام استفاده از بسط یا درون‌یابی (پشتیبانی از هر دو نسبت تصویر ۱۶:۹ و ۹:۱۶) و هنگام استفاده از referenceImages (فقط پشتیبانی از ۱۶:۹) باید "۸" باشد.
"4" ، "6" ، "8" "5" ، "6" ، "8"
personGeneration نسل انسان را کنترل می‌کند.
(برای محدودیت‌های منطقه‌ای به محدودیت‌ها مراجعه کنید)
تبدیل متن به ویدیو و افزونه:
فقط "allow_all"
تبدیل تصویر به ویدیو، درون‌یابی و تصاویر مرجع:
فقط "allow_adult"
تبدیل متن به ویدیو:
فقط "allow_all"
تبدیل تصویر به ویدیو:
فقط "allow_adult"
تبدیل متن به ویدیو:
"allow_all" ، "allow_adult" ، "dont_allow"
تبدیل تصویر به ویدیو:
"allow_adult" و "dont_allow"

توجه داشته باشید که پارامتر seed برای مدل‌های Veo 3 نیز موجود است. این پارامتر قطعیت را تضمین نمی‌کند، اما آن را کمی بهبود می‌بخشد.

شما می‌توانید با تنظیم پارامترها در درخواست خود، تولید ویدیوی خود را سفارشی کنید. برای مثال، می‌توانید negativePrompt برای هدایت مدل مشخص کنید.

پایتون

import time
from google import genai
from google.genai import types

client = genai.Client()

operation = client.models.generate_videos(
    model="veo-3.1-generate-preview",
    prompt="A cinematic shot of a majestic lion in the savannah.",
    config=types.GenerateVideosConfig(negative_prompt="cartoon, drawing, low quality"),
)

# Poll the operation status until the video is ready.
while not operation.done:
    print("Waiting for video generation to complete...")
    time.sleep(10)
    operation = client.operations.get(operation)

# Download the generated video.
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("parameters_example.mp4")
print("Generated video saved to parameters_example.mp4")

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

let operation = await ai.models.generateVideos({
  model: "veo-3.1-generate-preview",
  prompt: "A cinematic shot of a majestic lion in the savannah.",
  config: {
    aspectRatio: "16:9",
    negativePrompt: "cartoon, drawing, low quality"
  },
});

// Poll the operation status until the video is ready.
while (!operation.done) {
  console.log("Waiting for video generation to complete...")
  await new Promise((resolve) => setTimeout(resolve, 10000));
  operation = await ai.operations.getVideosOperation({
    operation: operation,
  });
}

// Download the generated video.
ai.files.download({
    file: operation.response.generatedVideos[0].video,
    downloadPath: "parameters_example.mp4",
});
console.log(`Generated video saved to parameters_example.mp4`);

برو

package main

import (
    "context"
    "log"
    "os"
    "time"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }

    videoConfig := &genai.GenerateVideosConfig{
        AspectRatio: "16:9",
        NegativePrompt: "cartoon, drawing, low quality",
    }

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-3.1-generate-preview",
        "A cinematic shot of a majestic lion in the savannah.",
        nil,
        videoConfig,
    )

    // Poll the operation status until the video is ready.
    for !operation.Done {
        log.Println("Waiting for video generation to complete...")
        time.Sleep(10 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    // Download the generated video.
    video := operation.Response.GeneratedVideos[0]
    client.Files.Download(ctx, video.Video, nil)
    fname := "parameters_example.mp4"
    _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    log.Printf("Generated video saved to %s\n", fname)
}

استراحت

# Note: This script uses jq to parse the JSON response.
# GEMINI API Base URL
BASE_URL="https://generativelanguage.googleapis.com/v1beta"

# Send request to generate video and capture the operation name into a variable.
operation_name=$(curl -s "${BASE_URL}/models/veo-3.1-generate-preview:predictLongRunning" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "A cinematic shot of a majestic lion in the savannah."
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "negativePrompt": "cartoon, drawing, low quality"
    }
  }' | jq -r .name)

# Poll the operation status until the video is ready
while true; do
  # Get the full JSON status and store it in a variable.
  status_response=$(curl -s -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${operation_name}")

  # Check the "done" field from the JSON stored in the variable.
  is_done=$(echo "${status_response}" | jq .done)

  if [ "${is_done}" = "true" ]; then
    # Extract the download URI from the final response.
    video_uri=$(echo "${status_response}" | jq -r '.response.generateVideoResponse.generatedSamples[0].video.uri')
    echo "Downloading video from: ${video_uri}"

    # Download the video using the URI and API key and follow redirects.
    curl -L -o parameters_example.mp4 -H "x-goog-api-key: $GEMINI_API_KEY" "${video_uri}"
    break
  fi
  # Wait for 5 seconds before checking again.
  sleep 10
done

راهنمای سریع Veo

این بخش شامل نمونه‌هایی از ویدیوهایی است که می‌توانید با استفاده از Veo ایجاد کنید و به شما نشان می‌دهد که چگونه می‌توانید اعلان‌ها را برای تولید نتایج متمایز تغییر دهید.

فیلترهای ایمنی

وئو فیلترهای ایمنی را در سراسر جمینی اعمال می‌کند تا اطمینان حاصل شود که ویدیوهای تولید شده و عکس‌های آپلود شده حاوی محتوای توهین‌آمیز نیستند. اعلان‌هایی که شرایط و ضوابط ما را نقض می‌کنند، مسدود می‌شوند.

اصول اولیه نوشتن سریع

پیشنهادهای خوب، توصیفی و واضح هستند. برای اینکه بیشترین بهره را از Veo ببرید، با شناسایی ایده اصلی خود شروع کنید، ایده خود را با اضافه کردن کلمات کلیدی و اصلاح‌کننده‌ها اصلاح کنید و اصطلاحات خاص ویدیو را در پیشنهادهای خود بگنجانید.

عناصر زیر باید در درخواست شما گنجانده شوند:

  • موضوع : شیء، شخص، حیوان یا منظره‌ای که می‌خواهید در ویدیوی شما باشد، مانند منظره شهری ، طبیعت ، وسایل نقلیه یا توله سگ‌ها .
  • عمل : کاری که سوژه انجام می‌دهد (مثلاً راه رفتن ، دویدن یا چرخاندن سر ).
  • سبک : جهت‌گیری خلاقانه را با استفاده از کلمات کلیدی خاص سبک فیلم، مانند علمی تخیلی ، فیلم ترسناک ، فیلم نوآر یا سبک‌های انیمیشن مانند کارتون ، مشخص کنید.
  • موقعیت و حرکت دوربین : [اختیاری] موقعیت و حرکت دوربین را با استفاده از عباراتی مانند نمای هوایی ، تراز چشم ، نمای بالا به پایین ، نمای دالی یا نمای کرمی کنترل کنید.
  • ترکیب‌بندی : [اختیاری] نحوه‌ی قاب‌بندی نما، مانند نمای باز ، نمای نزدیک ، تک‌عکس یا دوعکس .
  • فوکوس و جلوه‌های لنز : [اختیاری] برای دستیابی به جلوه‌های بصری خاص، از اصطلاحاتی مانند فوکوس سطحی ، فوکوس عمیق ، فوکوس نرم ، لنز ماکرو و لنز واید استفاده کنید.
  • محیط : [اختیاری] نحوه‌ی تأثیرگذاری رنگ و نور بر صحنه، مانند تُن‌های آبی ، شب یا تُن‌های گرم .

نکات بیشتر برای نوشتن سوالات امتحانی

  • از زبان توصیفی استفاده کنید : از صفت‌ها و قیدها برای ترسیم تصویری واضح از Veo استفاده کنید.
  • جزئیات صورت را برجسته کنید : جزئیات صورت را به عنوان نقطه کانونی عکس مشخص کنید، مثلاً از کلمه پرتره در سوال استفاده کنید.

برای استراتژی‌های جامع‌تر برای ایجاد انگیزه، به مقدمه‌ای بر طراحی انگیزه مراجعه کنید.

درخواست صدا

با Veo 3، می‌توانید نشانه‌هایی برای جلوه‌های صوتی، نویز محیط و دیالوگ ارائه دهید. این مدل، ظرافت این نشانه‌ها را برای تولید موسیقی متن هماهنگ ضبط می‌کند.

  • گفتگو: از نقل قول برای گفتار خاص استفاده کنید. (مثال: او زمزمه کرد: «این باید کلید باشد.»)
  • جلوه‌های صوتی (SFX): صداها را به طور واضح توصیف کنید. (مثال: صدای جیغ لاستیک‌ها، غرش موتور.)
  • سر و صدای محیط: منظره صوتی محیط را توصیف کنید. (مثال: صدای زمزمه‌ای ضعیف و وهم‌آور در پس‌زمینه طنین‌انداز می‌شود.)

این ویدیوها، تولید صدای Veo 3 را با سطوح فزاینده‌ای از جزئیات نشان می‌دهند.

سریع خروجی تولید شده
جزئیات بیشتر (دیالوگ و فضاسازی)
نمای باز از جنگلی مه‌آلود در شمال غربی اقیانوس آرام. دو کوهنورد خسته، یک مرد و یک زن، در میان سرخس‌ها به پیش می‌روند که ناگهان مرد می‌ایستد و به درختی خیره می‌شود. نمای نزدیک: جای پنجه‌های تازه و عمیق روی پوست درخت کنده شده است. مرد: (دستش روی چاقوی شکارش است) "این خرس معمولی نیست." زن: (با صدایی گرفته از ترس، در حالی که جنگل را بررسی می‌کند) "پس چیست؟" صدای پارس خشن، شکستن شاخه‌ها، صدای قدم‌هایی روی زمین مرطوب. صدای جیک‌جیک یک پرنده تنها.
دو نفر در جنگل با نشانه هایی از خرس مواجه می شوند.
جزئیات کمتر (دیالوگ)
انیمیشن برش کاغذ. کتابدار جدید: «کتاب‌های ممنوعه را کجا نگه می‌دارید؟» متصدی قدیمی: «ما این کار را نمی‌کنیم. آنها ما را نگه می‌دارند.»
کتابداران انیمیشنی در حال بحث در مورد کتاب‌های ممنوعه

برای شنیدن صدا، خودتان این سوالات را امتحان کنید! Veo 3 را امتحان کنید.

راهنمایی با تصاویر مرجع

شما می‌توانید با استفاده از قابلیت‌های تبدیل تصویر به ویدیو در Veo، از یک یا چند تصویر به عنوان ورودی برای هدایت ویدیوهای تولید شده خود استفاده کنید. Veo از تصویر ورودی به عنوان فریم اولیه استفاده می‌کند. تصویری را که به آنچه به عنوان اولین صحنه ویدیوی خود تصور می‌کنید، نزدیک‌تر است انتخاب کنید تا اشیاء روزمره را متحرک کنید، به نقاشی‌ها و طرح‌ها جان ببخشید و به صحنه‌های طبیعت حرکت و صدا اضافه کنید.

سریع خروجی تولید شده
تصویر ورودی (تولید شده توسط نانو موز)
یک عکس ماکروی فوق واقعی از موج‌سواران کوچک و مینیاتوری که در حال موج‌سواری در امواج اقیانوس درون یک سینک حمام سنگی روستیک هستند. یک شیر آب برنجی قدیمی در حال اجرا است و موج‌های دائمی را ایجاد می‌کند. نورپردازی طبیعی سورئال، خیال‌انگیز و درخشان.
موج‌سواران کوچک و مینیاتوری که در حال موج‌سواری در امواج اقیانوس درون یک روشویی سنگی روستیک در حمام هستند.
خروجی ویدیو (تولید شده توسط Veo 3.1)
یک ویدیوی ماکروی سورئال و سینمایی. موج‌سواران کوچک در یک سینک سنگی حمام، موج‌های دائمی و غلتان را می‌رانند. یک شیر آب برنجی قدیمی، موج‌های بی‌پایان را خلق می‌کند. دوربین به آرامی در صحنه‌ی خیال‌انگیز و روشن از آفتاب حرکت می‌کند، در حالی که این موجودات مینیاتوری ماهرانه آب فیروزه‌ای را تراش می‌دهند.
موج‌سواران کوچکی که در سینک حمام دور امواج می‌چرخند.

Veo 3.1 به شما امکان می‌دهد تصاویر یا مواد اولیه را برای هدایت محتوای ویدیوی تولید شده خود ارجاع دهید. حداکثر سه تصویر از یک شخص، شخصیت یا محصول ارائه دهید. Veo ظاهر سوژه را در ویدیوی خروجی حفظ می‌کند.

سریع خروجی تولید شده
تصویر مرجع (تولید شده توسط نانو موز)
یک ماهی قلابچه ماهی در اعماق آب‌های تاریک، با دندان‌های نمایان و طعمه درخشان، کمین کرده است.
ماهی انگلر تیره و درخشان
تصویر مرجع (تولید شده توسط نانو موز)
یک لباس پرنسسی کودک صورتی رنگ به همراه عصا و تاج، روی زمینه ساده محصول.
یک پرنسس صورتی کودک
خروجی ویدیو (تولید شده توسط Veo 3.1)
یک نسخه کارتونی بامزه از ماهی که لباس مخصوص را پوشیده، شنا می‌کند و چوب جادو را تکان می‌دهد، درست کنید.
ماهی قلابچه ای که لباس پرنسسی پوشیده است

با استفاده از Veo 3.1، می‌توانید با مشخص کردن اولین و آخرین فریم‌های ویدیو، ویدیو تولید کنید.

سریع خروجی تولید شده
تصویر اول (تولید شده توسط نانو موز)
یک تصویر واقعی با کیفیت بالا از یک گربه مو قرمز که در حال راندن یک ماشین مسابقه‌ای کروک قرمز در ساحل ریویرای فرانسه است.
یک گربه قرمز رنگ که یک ماشین مسابقه‌ای کروک قرمز را می‌راند
تصویر آخر (تولید شده توسط نانو موز)
نشان دهید وقتی ماشین از صخره بلند می‌شود چه اتفاقی می‌افتد.
یک گربه قرمز رنگ که سوار بر یک خودروی کروک قرمز رنگ است، از صخره سقوط می‌کند
خروجی ویدیو (تولید شده توسط Veo 3.1)
اختیاری
گربه‌ای از صخره‌ای عبور می‌کند و پرواز می‌کند

این ویژگی با امکان تعریف فریم شروع و پایان، کنترل دقیقی بر ترکیب‌بندی تصویر به شما می‌دهد. یک تصویر آپلود کنید یا از یک فریم از نسل قبلی ویدیو استفاده کنید تا مطمئن شوید صحنه شما دقیقاً همانطور که تصور می‌کنید شروع و پایان می‌یابد.

درخواست تمدید

برای گسترش ویدیوی تولید شده توسط Veo خود با Veo 3.1، از ویدیو به عنوان ورودی به همراه یک متن اختیاری استفاده کنید. Extend ثانیه آخر یا 24 فریم ویدیوی شما را نهایی می‌کند و عملیات را ادامه می‌دهد.

توجه داشته باشید که اگر صدا در ۱ ثانیه آخر ویدیو وجود نداشته باشد، نمی‌توان آن را به طور مؤثر گسترش داد.

سریع خروجی تولید شده
ویدیوی ورودی (تولید شده توسط Veo 3.1)
پاراگلایدر از بالای کوه بلند می‌شود و شروع به سر خوردن از کوه‌ها می‌کند و مشرف به دره‌های پوشیده از گل در پایین است.
یک پاراگلایدر از بالای کوه بلند می‌شود
خروجی ویدیو (تولید شده توسط Veo 3.1)
این ویدیو را با پاراگلایدر که به آرامی در حال پایین آمدن است، ادامه دهید.
یک پاراگلایدر از بالای کوه بلند می‌شود و سپس به آرامی پایین می‌آید

مثال‌های درخواست و خروجی

این بخش چندین نکته را ارائه می‌دهد و نشان می‌دهد که چگونه جزئیات توصیفی می‌توانند نتیجه هر ویدیو را ارتقا دهند.

قندیل‌ها

این ویدیو نشان می‌دهد که چگونه می‌توانید از عناصر اصول اولیه نگارش سریع در متن خود استفاده کنید.

سریع خروجی تولید شده
نمای نزدیک (ترکیب‌بندی) از قندیل‌های یخی در حال ذوب (سوژه) روی دیوار سنگی یخ‌زده (زمینه) با تُن‌های آبی سرد (فضا)، بزرگنمایی (حرکت دوربین) با حفظ جزئیات نمای نزدیک از قطرات آب (کنش). قندیل‌های یخی چکه‌کننده با پس‌زمینه آبی.

مرد پشت تلفن

این ویدیوها نشان می‌دهند که چگونه می‌توانید درخواست خود را با جزئیات دقیق‌تر اصلاح کنید تا Veo خروجی را مطابق میل شما اصلاح کند.

سریع خروجی تولید شده
جزئیات کمتر
دوربین برای نشان دادن نمای نزدیکی از مردی درمانده با پالتوی سبزرنگ، روی صفحه نمایش حرکت می‌کند. او در حال برقراری تماس با تلفن دیواری چرخشی با چراغ نئون سبز است. این صحنه شبیه صحنه‌ای از یک فیلم است.
مردی که با تلفن صحبت می‌کند.
جزئیات بیشتر
یک نمای نزدیک سینمایی، مردی ناامید را با پالتوی سبز کهنه در حالی که با تلفن چرخشی نصب شده روی دیوار آجری ناهموار، غرق در درخشش وهم‌آور یک تابلوی نئون سبز، شماره می‌گیرد، دنبال می‌کند. دوربین به آرامی وارد می‌شود و تنش در فک او و ناامیدی حک شده بر چهره‌اش را در حالی که برای برقراری تماس تقلا می‌کند، نشان می‌دهد. عمق میدان کم بر ابروهای درهم کشیده و تلفن چرخشی سیاه متمرکز شده و پس‌زمینه را در دریایی از رنگ‌های نئونی و سایه‌های نامشخص محو می‌کند و حس فوریت و انزوا را ایجاد می‌کند.
مردی در حال صحبت با تلفن

پلنگ برفی

سریع خروجی تولید شده
دستور ساده:
یک موجود بامزه با خزی شبیه پلنگ برفی در جنگل زمستانی قدم می‌زند، رندر به سبک کارتونی سه‌بعدی.
پلنگ برفی بی‌حال است.
دستورالعمل تفصیلی:
یک صحنه انیمیشن سه بعدی کوتاه به سبک کارتونی شاد ایجاد کنید. موجودی بامزه با خز پلنگ برفی، چشمان بزرگ و رسا و اندامی دوستانه و گرد، با خوشحالی در یک جنگل زمستانی خیال‌انگیز قدم می‌زند. این صحنه باید شامل درختان گرد و پوشیده از برف، دانه‌های برف ملایم در حال ریزش و نور گرم خورشید که از میان شاخه‌ها عبور می‌کند، باشد. حرکات پرشی و لبخند پهن موجود باید لذت خالص را منتقل کند. سعی کنید لحنی شاد و دلگرم‌کننده با رنگ‌های روشن و شاد و انیمیشنی بازیگوشانه داشته باشید.
پلنگ برفی سریعتر می دود.

مثال‌ها با نوشتن عناصر

این مثال‌ها به شما نشان می‌دهند که چگونه می‌توانید سوالات خود را بر اساس هر عنصر اساسی اصلاح کنید.

موضوع و زمینه

تمرکز اصلی (موضوع) و پس‌زمینه یا محیط (زمینه) را مشخص کنید.

سریع خروجی تولید شده
یک رندر معماری از یک آپارتمان بتنی سفید با اشکال ارگانیک روان، که به طور یکپارچه با فضای سبز سرسبز و عناصر آینده‌نگر ترکیب شده است. نگهدارنده مکان.
ماهواره‌ای که در فضا شناور است و ماه و چند ستاره در پس‌زمینه دیده می‌شوند. ماهواره‌ای که در جو شناور است.

اکشن

مشخص کنید که سوژه چه کاری انجام می‌دهد (مثلاً راه می‌رود، می‌دود یا سرش را می‌چرخاند).

سریع خروجی تولید شده
نمایی باز از زنی که در امتداد ساحل قدم می‌زند، با نگاهی راضی و آرام به افق در هنگام غروب آفتاب. غروب آفتاب کاملاً زیباست.

سبک

کلمات کلیدی را اضافه کنید تا نسل را به سمت یک زیبایی‌شناسی خاص هدایت کنید (مثلاً سورئال، وینتیج، فوتوریستی، فیلم نوآر).

سریع خروجی تولید شده
سبک فیلم نوآر، مرد و زن در خیابان قدم می‌زنند، معمایی، سینمایی، سیاه و سفید. سبک فیلم نوآر واقعاً زیباست.

حرکت دوربین و ترکیب‌بندی

نحوه حرکت دوربین (نمای POV، نمای هوایی، نمای پهپاد در حال تعقیب) و نحوه قاب‌بندی نما (نمای باز، نمای نزدیک، نمای پایین) را مشخص کنید.

سریع خروجی تولید شده
نمای زاویه دید از داخل یک ماشین قدیمی که زیر باران رانندگی می‌کند، کانادا در شب، سینمایی. غروب آفتاب کاملاً زیباست.
نمای بسیار نزدیک از یک چشم که شهر در آن منعکس شده است. غروب آفتاب کاملاً زیباست.

محیط

پالت‌های رنگی و نورپردازی بر حال و هوا تأثیر می‌گذارند. اصطلاحاتی مانند «رنگ‌های گرم نارنجی ملایم»، «نور طبیعی»، «طلوع آفتاب» یا «رنگ‌های آبی سرد» را امتحان کنید.

سریع خروجی تولید شده
نمای نزدیک از دختری که توله سگ گلدن رتریور دوست داشتنی را در پارک در آغوش گرفته است، در حالی که نور خورشید می‌تابد. توله سگی در آغوش دختر بچه ای.
نمای نزدیک سینمایی از زنی غمگین که در باران سوار اتوبوس است، تُن‌های آبی سرد، حال و هوای غمگین. زنی که سوار اتوبوس است و احساس غم و اندوه می‌کند.

پیام‌های منفی

پیام‌های منفی، عناصری را که نمی‌خواهید در ویدیو باشند، مشخص می‌کنند.

  • ❌ از زبان دستوری مانند «نه» یا «نکن » استفاده نکنید (مثلاً «دیوار ممنوع»).
  • ✅ حتماً چیزی را که نمی‌خواهید ببینید توصیف کنید. (مثلاً «دیوار، قاب»).
سریع خروجی تولید شده
بدون اشاره منفی:
یک انیمیشن کوتاه و سبک‌دار از یک درخت بلوط بزرگ و تنها با برگ‌هایی که در باد شدید به شدت تکان می‌خورند، بسازید... [کوتاه شده]
درخت با استفاده از کلمات.
با پیشنهاد منفی:
[همان درخواست]

محرک منفی: پس‌زمینه شهری، سازه‌های ساخته دست بشر، فضای تاریک، طوفانی یا تهدیدآمیز.
درختی بدون کلمات منفی.

نسبت‌های ابعاد

Veo به شما امکان می‌دهد نسبت ابعاد ویدیوی خود را مشخص کنید.

سریع خروجی تولید شده
صفحه عریض (16:9)
با استفاده از یک پهپاد ردیابی، ویدیویی از مردی که در حال رانندگی با یک ماشین کروک قرمز در پالم اسپرینگز، دهه ۱۹۷۰ است، با نور گرم خورشید و سایه‌های بلند، بسازید.
مردی در حال رانندگی با یک ماشین کروک قرمز در پالم اسپرینگز، به سبک دهه ۱۹۷۰.
پرتره (۹:۱۶)
ویدیویی بسازید که حرکت روان یک آبشار باشکوه هاوایی را در دل یک جنگل بارانی سرسبز برجسته کند. برای انتقال آرامش، روی جریان آب واقع‌گرایانه، شاخ و برگ‌های دقیق و نورپردازی طبیعی تمرکز کنید. آب خروشان، فضای مه‌آلود و نور خورشید لکه‌دار را که از میان سایبان انبوه عبور می‌کند، به تصویر بکشید. از حرکات نرم و سینمایی دوربین برای نمایش آبشار و محیط اطراف آن استفاده کنید. سعی کنید لحنی آرام و واقع‌گرایانه داشته باشید و بیننده را به زیبایی آرام جنگل بارانی هاوایی منتقل کنید.
آبشاری باشکوه در هاوایی، در دل جنگل‌های بارانی سرسبز.

محدودیت‌ها

  • تأخیر درخواست: حداقل: ۱۱ ثانیه؛ حداکثر: ۶ دقیقه (در ساعات اوج مصرف).
  • محدودیت‌های منطقه‌ای: در کشورهای عضو اتحادیه اروپا، بریتانیا، جمهوری خلق چین و خاورمیانه و شمال آفریقا، مقادیر مجاز برای personGeneration به شرح زیر است:
    • نسخه ۳: فقط allow_adult .
    • نسخه ۲: dont_allow و allow_adult . مقدار پیش‌فرض dont_allow است.
  • نگهداری ویدیو: ویدیوهای تولید شده به مدت ۲ روز در سرور ذخیره می‌شوند و پس از آن حذف می‌شوند. برای ذخیره یک نسخه محلی، باید ویدیوی خود را ظرف ۲ روز پس از تولید دانلود کنید. ویدیوهای توسعه‌یافته به عنوان ویدیوهای تازه تولید شده در نظر گرفته می‌شوند.
  • واترمارک: ویدیوهای ساخته شده توسط Veo با استفاده از SynthID ، ابزار ما برای واترمارک و شناسایی محتوای تولید شده توسط هوش مصنوعی، واترمارک می‌شوند. ویدیوها را می‌توان با استفاده از پلتفرم تأیید SynthID تأیید کرد.
  • ایمنی: ویدیوهای تولید شده از فیلترهای ایمنی و فرآیندهای بررسی حافظه عبور داده می‌شوند که به کاهش خطرات مربوط به حریم خصوصی، حق چاپ و تعصب کمک می‌کند.
  • خطای صوتی: Veo 3.1 گاهی اوقات به دلیل فیلترهای ایمنی یا سایر مشکلات پردازش صدا، مانع از تولید ویدیو می‌شود. در صورت مسدود شدن تولید ویدیوی شما، هزینه‌ای از شما دریافت نخواهد شد.

ویژگی‌های مدل

ویژگی توضیحات ویو ۳.۱ و ویو ۳.۱ سریع ویو ۳ و ویو ۳ فست وئو ۲
صوتی به صورت بومی صدا را با ویدیو تولید می‌کند. به صورت بومی صدا را با ویدیو تولید می‌کند. ✔️ همیشه روشن ❌ فقط بی‌صدا
روش‌های ورودی نوع ورودی مورد استفاده برای تولید. تبدیل متن به ویدیو، تصویر به ویدیو، ویدیو به ویدیو تبدیل متن به ویدیو، تبدیل تصویر به ویدیو تبدیل متن به ویدیو، تبدیل تصویر به ویدیو
وضوح تصویر وضوح خروجی ویدیو. ۷۲۰p و ۱۰۸۰p (فقط مدت زمان ۸ ثانیه)

فقط هنگام استفاده از افزونه ویدیویی، کیفیت 720p ارائه می‌شود.
720p و 1080p (فقط 16:9) ۷۲۰p
نرخ فریم نرخ فریم خروجی ویدیو. ۲۴ فریم در ثانیه ۲۴ فریم در ثانیه ۲۴ فریم در ثانیه
مدت زمان ویدیو مدت زمان ویدیوی تولید شده. ۸ ثانیه، ۶ ثانیه، ۴ ثانیه
فقط ۸ ثانیه هنگام استفاده از تصاویر مرجع
۸ ثانیه ۵-۸ ثانیه
ویدیوها به ازای هر درخواست تعداد ویدیوهای تولید شده به ازای هر درخواست. ۱ ۱ ۱ یا ۲
وضعیت و جزئیات موجودی مدل و جزئیات بیشتر پیش‌نمایش پایدار پایدار

نسخه‌های مدل

برای جزئیات بیشتر در مورد استفاده از مدل‌های خاص Veo، به صفحات قیمت‌گذاری و محدودیت‌های نرخ مراجعه کنید.

پیش‌نمایش ویو ۳.۱

ملک توضیحات
کد مدل

رابط برنامه‌نویسی کاربردی Gemini

veo-3.1-generate-preview

انواع داده پشتیبانی شده را

ورودی

متن، تصویر

خروجی

ویدئو با صدا

ورودی متن

۱,۰۲۴ توکن

خروجی ویدئو

۱

آخرین به‌روزرسانی سپتامبر ۲۰۲۵

پیش‌نمایش سریع Veo 3.1

ملک توضیحات
کد مدل

رابط برنامه‌نویسی کاربردی Gemini

veo-3.1-fast-generate-preview

انواع داده پشتیبانی شده را

ورودی

متن، تصویر

خروجی

ویدئو با صدا

ورودی متن

۱,۰۲۴ توکن

خروجی ویدئو

۱

آخرین به‌روزرسانی سپتامبر ۲۰۲۵

وئو ۳

ملک توضیحات
کد مدل

رابط برنامه‌نویسی کاربردی Gemini

veo-3.0-generate-001

انواع داده پشتیبانی شده را

ورودی

متن، تصویر

خروجی

ویدئو با صدا

ورودی متن

۱,۰۲۴ توکن

خروجی ویدئو

۱

آخرین به‌روزرسانی ژوئیه ۲۰۲۵

وئو ۳ سریع

Veo 3 Fast به توسعه‌دهندگان اجازه می‌دهد تا ویدیوهایی با صدا بسازند و در عین حال کیفیت بالا را حفظ کرده و برای سرعت و موارد استفاده تجاری بهینه کنند. این ابزار برای سرویس‌های backend که به صورت برنامه‌نویسی شده تبلیغات تولید می‌کنند، ابزارهایی برای تست سریع A/B از مفاهیم خلاقانه یا برنامه‌هایی که نیاز به تولید سریع محتوای رسانه‌های اجتماعی دارند، ایده‌آل است.
ملک توضیحات
کد مدل

رابط برنامه‌نویسی کاربردی Gemini

veo-3.0-fast-generate-001

انواع داده پشتیبانی شده را

ورودی

متن، تصویر

خروجی

ویدئو با صدا

ورودی متن

۱,۰۲۴ توکن

خروجی ویدئو

۱

آخرین به‌روزرسانی ژوئیه ۲۰۲۵

وئو ۲

ملک توضیحات
کد مدل

رابط برنامه‌نویسی کاربردی Gemini

veo-2.0-generate-001

انواع داده پشتیبانی شده را

ورودی

متن، تصویر

خروجی

ویدئو

ورودی متن

ناموجود

ورودی تصویر

هر وضوح تصویر و نسبت ابعادی تا حجم فایل ۲۰ مگابایت

خروجی ویدئو

تا ۲

آخرین به‌روزرسانی آوریل ۲۰۲۵

قدم بعدی چیست؟