Veo 3.1 مدل پیشرفته گوگل برای تولید ویدیوهای 8 ثانیهای با کیفیت 720p یا 1080p با وضوح بالا و واقعگرایی خیرهکننده و صدای تولید شده بومی است. میتوانید با استفاده از Gemini API به صورت برنامهنویسی شده به این مدل دسترسی پیدا کنید. برای کسب اطلاعات بیشتر در مورد انواع مدلهای Veo موجود، به بخش نسخههای مدل مراجعه کنید.
Veo 3.1 در طیف گستردهای از سبکهای بصری و سینمایی برتری دارد و چندین قابلیت جدید را معرفی میکند:
- افزونه ویدیو : ویدیوهایی را که قبلاً با استفاده از Veo تولید شده بودند، گسترش دهید.
- تولید فریم خاص : با مشخص کردن اولین و آخرین فریم، یک ویدیو تولید کنید.
- جهتدهی مبتنی بر تصویر : از حداکثر سه تصویر مرجع برای هدایت محتوای ویدیوی تولید شده خود استفاده کنید.
برای اطلاعات بیشتر در مورد نوشتن متنهای پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.
تولید متن به ویدیو
برای دیدن نحوه تولید ویدیو با دیالوگ، رئالیسم سینمایی یا انیمیشن خلاقانه، یک مثال را انتخاب کنید:
پایتون
import time
from google import genai
from google.genai import types
client = genai.Client()
prompt = """A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'"""
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the generated video.
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("dialogue_example.mp4")
print("Generated video saved to dialogue_example.mp4")
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const prompt = `A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'`;
let operation = await ai.models.generateVideos({
model: "veo-3.1-generate-preview",
prompt: prompt,
});
// Poll the operation status until the video is ready.
while (!operation.done) {
console.log("Waiting for video generation to complete...")
await new Promise((resolve) => setTimeout(resolve, 10000));
operation = await ai.operations.getVideosOperation({
operation: operation,
});
}
// Download the generated video.
ai.files.download({
file: operation.response.generatedVideos[0].video,
downloadPath: "dialogue_example.mp4",
});
console.log(`Generated video saved to dialogue_example.mp4`);
برو
package main
import (
"context"
"log"
"os"
"time"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
prompt := `A close up of two people staring at a cryptic drawing on a wall, torchlight flickering.
A man murmurs, 'This must be it. That's the secret code.' The woman looks at him and whispering excitedly, 'What did you find?'`
operation, _ := client.Models.GenerateVideos(
ctx,
"veo-3.1-generate-preview",
prompt,
nil,
nil,
)
// Poll the operation status until the video is ready.
for !operation.Done {
log.Println("Waiting for video generation to complete...")
time.Sleep(10 * time.Second)
operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
}
// Download the generated video.
video := operation.Response.GeneratedVideos[0]
client.Files.Download(ctx, video.Video, nil)
fname := "dialogue_example.mp4"
_ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
log.Printf("Generated video saved to %s\n", fname)
}
استراحت
# Note: This script uses jq to parse the JSON response.
# GEMINI API Base URL
BASE_URL="https://generativelanguage.googleapis.com/v1beta"
# Send request to generate video and capture the operation name into a variable.
operation_name=$(curl -s "${BASE_URL}/models/veo-3.1-generate-preview:predictLongRunning" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X "POST" \
-d '{
"instances": [{
"prompt": "A close up of two people staring at a cryptic drawing on a wall, torchlight flickering. A man murmurs, \"This must be it. That'\''s the secret code.\" The woman looks at him and whispering excitedly, \"What did you find?\""
}
]
}' | jq -r .name)
# Poll the operation status until the video is ready
while true; do
# Get the full JSON status and store it in a variable.
status_response=$(curl -s -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${operation_name}")
# Check the "done" field from the JSON stored in the variable.
is_done=$(echo "${status_response}" | jq .done)
if [ "${is_done}" = "true" ]; then
# Extract the download URI from the final response.
video_uri=$(echo "${status_response}" | jq -r '.response.generateVideoResponse.generatedSamples[0].video.uri')
echo "Downloading video from: ${video_uri}"
# Download the video using the URI and API key and follow redirects.
curl -L -o dialogue_example.mp4 -H "x-goog-api-key: $GEMINI_API_KEY" "${video_uri}"
break
fi
# Wait for 5 seconds before checking again.
sleep 10
done
تولید تصویر به ویدیو
کد زیر تولید یک تصویر با استفاده از Gemini 2.5 Flash Image یا همان Nano Banana را نشان میدهد، سپس از آن تصویر به عنوان فریم شروع برای تولید ویدیو با Veo 3.1 استفاده میکند.
پایتون
import time
from google import genai
client = genai.Client()
prompt = "Panning wide shot of a calico kitten sleeping in the sunshine"
# Step 1: Generate an image with Nano Banana.
image = client.models.generate_content(
model="gemini-2.5-flash-image",
prompt=prompt,
)
# Step 2: Generate video with Veo 3.1 using the image.
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
image=image.generated_images[0].image,
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3_with_image_input.mp4")
print("Generated video saved to veo3_with_image_input.mp4")
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const prompt = "Panning wide shot of a calico kitten sleeping in the sunshine";
// Step 1: Generate an image with Nano Banana.
const imageResponse = await ai.models.generateContent({
model: "gemini-2.5-flash-image",
prompt: prompt,
});
// Step 2: Generate video with Veo 3.1 using the image.
let operation = await ai.models.generateVideos({
model: "veo-3.1-generate-preview",
prompt: prompt,
image: {
imageBytes: imageResponse.generatedImages[0].image.imageBytes,
mimeType: "image/png",
},
});
// Poll the operation status until the video is ready.
while (!operation.done) {
console.log("Waiting for video generation to complete...")
await new Promise((resolve) => setTimeout(resolve, 10000));
operation = await ai.operations.getVideosOperation({
operation: operation,
});
}
// Download the video.
ai.files.download({
file: operation.response.generatedVideos[0].video,
downloadPath: "veo3_with_image_input.mp4",
});
console.log(`Generated video saved to veo3_with_image_input.mp4`);
برو
package main
import (
"context"
"log"
"os"
"time"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
prompt := "Panning wide shot of a calico kitten sleeping in the sunshine"
// Step 1: Generate an image with Nano Banana.
imageResponse, err := client.Models.GenerateContent(
ctx,
"gemini-2.5-flash-image",
prompt,
nil, // GenerateImagesConfig
)
if err != nil {
log.Fatal(err)
}
// Step 2: Generate video with Veo 3.1 using the image.
operation, err := client.Models.GenerateVideos(
ctx,
"veo-3.1-generate-preview",
prompt,
imageResponse.GeneratedImages[0].Image,
nil, // GenerateVideosConfig
)
if err != nil {
log.Fatal(err)
}
// Poll the operation status until the video is ready.
for !operation.Done {
log.Println("Waiting for video generation to complete...")
time.Sleep(10 * time.Second)
operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
}
// Download the video.
video := operation.Response.GeneratedVideos[0]
client.Files.Download(ctx, video.Video, nil)
fname := "veo3_with_image_input.mp4"
_ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
log.Printf("Generated video saved to %s\n", fname)
}
استفاده از تصاویر مرجع
Veo 3.1 اکنون حداکثر ۳ تصویر مرجع را برای هدایت محتوای ویدیوی تولید شده شما میپذیرد. تصاویری از یک شخص، شخصیت یا محصول را ارائه دهید تا ظاهر سوژه در ویدیوی خروجی حفظ شود.
برای مثال، با استفاده از این سه تصویر تولید شده با نانو موز به عنوان مرجع و یک دستورالعمل خوب نوشته شده، ویدیوی زیر ایجاد میشود:
`dress_image` | `woman_image` | `glasses_image` |
---|---|---|
![]() | ![]() | ![]() |
پایتون
import time
from google import genai
client = genai.Client()
prompt = "The video opens with a medium, eye-level shot of a beautiful woman with dark hair and warm brown eyes. She wears a magnificent, high-fashion flamingo dress with layers of pink and fuchsia feathers, complemented by whimsical pink, heart-shaped sunglasses. She walks with serene confidence through the crystal-clear, shallow turquoise water of a sun-drenched lagoon. The camera slowly pulls back to a medium-wide shot, revealing the breathtaking scene as the dress's long train glides and floats gracefully on the water's surface behind her. The cinematic, dreamlike atmosphere is enhanced by the vibrant colors of the dress against the serene, minimalist landscape, capturing a moment of pure elegance and high-fashion fantasy."
dress_reference = types.VideoGenerationReferenceImage(
image=dress_image, # Generated separately with Nano Banana
reference_type="asset"
)
sunglasses_reference = types.VideoGenerationReferenceImage(
image=glasses_image, # Generated separately with Nano Banana
reference_type="asset"
)
woman_reference = types.VideoGenerationReferenceImage(
image=woman_image, # Generated separately with Nano Banana
reference_type="asset"
)
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
reference_images=[dress_reference, glasses_reference, woman_reference],
),
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_with_reference_images.mp4")
print("Generated video saved to veo3.1_with_reference_images.mp4")
استفاده از فریمهای اول و آخر
Veo 3.1 به شما امکان میدهد با استفاده از درونیابی یا مشخص کردن اولین و آخرین فریمهای ویدیو، ویدیو ایجاد کنید. برای اطلاعات بیشتر در مورد نوشتن متنهای پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.
پایتون
import time
from google import genai
client = genai.Client()
prompt = "A cinematic, haunting video. A ghostly woman with long white hair and a flowing dress swings gently on a rope swing beneath a massive, gnarled tree in a foggy, moonlit clearing. The fog thickens and swirls around her, and she slowly fades away, vanishing completely. The empty swing is left swaying rhythmically on its own in the eerie silence."
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
image=first_image, # Generated separately with Nano Banana
config=types.GenerateVideosConfig(
last_frame=last_image # Generated separately with Nano Banana
),
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_with_interpolation.mp4")
print("Generated video saved to veo3.1_with_interpolation.mp4")
`first_image` | `last_image` | veo3.1_with_interpolation.mp4 |
---|---|---|
![]() | ![]() | ![]() |
گسترش ویدیوهای Veo
از Veo 3.1 برای افزایش طول ویدیوهایی که قبلاً با Veo تولید کردهاید، به میزان ۷ ثانیه و تا ۲۰ برابر استفاده کنید.
محدودیتهای ویدیوی ورودی:
- ویدیوهای تولید شده توسط وئو فقط تا ۱۴۱ ثانیه.
- رابط برنامهنویسی نرمافزار Gemini فقط از افزونههای ویدیویی برای ویدیوهای تولید شده توسط Veo پشتیبانی میکند.
- انتظار میرود ویدیوهای ورودی طول، نسبت ابعاد و ابعاد مشخصی داشته باشند:
- نسبت تصویر: ۹:۱۶ یا ۱۶:۹
- وضوح تصویر: ۷۲۰p
- طول ویدیو: ۱۴۱ ثانیه یا کمتر
خروجی این افزونه یک ویدیوی واحد است که از ترکیب ویدیوی ورودی کاربر و ویدیوی توسعهیافتهی تولید شده تا سقف ۱۴۸ ثانیه ساخته شده است.
این مثال، ویدیوی butterfly_video تولید شده توسط Veo را که در اینجا با اعلان اصلی آن نشان داده شده است، میگیرد و آن را با استفاده از پارامتر video
و یک اعلان جدید، گسترش میدهد:
سریع | خروجی: butterfly_video |
---|---|
یک پروانه اوریگامی بالهایش را به هم میزند و از درهای فرانسوی به داخل باغ پرواز میکند. | ![]() |
پایتون
import time
from google import genai
client = genai.Client()
prompt = "Track the butterfly into the garden as it lands on an orange origami flower. A fluffy white puppy runs up and gently pats the flower."
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
video=butterfly_video,
prompt=prompt,
config=types.GenerateVideosConfig(
number_of_videos=1,
resolution="720p"
),
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the video.
video = operation.response.generated_videos[0]
client.files.download(file=video.video)
video.video.save("veo3.1_extension.mp4")
print("Generated video saved to veo3.1_extension.mp4")
برای اطلاعات در مورد نوشتن متنهای پیشنهادی مؤثر برای تولید ویدیو، به راهنمای Veo prompt مراجعه کنید.
مدیریت عملیات ناهمزمان
تولید ویدیو یک کار محاسباتی فشرده است. وقتی درخواستی را به API ارسال میکنید، یک کار طولانی مدت را شروع میکند و بلافاصله یک شیء operation
را برمیگرداند. سپس باید تا زمانی که ویدیو آماده شود، نظرسنجی کنید، که با وضعیت done
درست نشان داده میشود.
هسته اصلی این فرآیند یک حلقه نظرسنجی است که به صورت دورهای وضعیت کار را بررسی میکند.
پایتون
import time
from google import genai
from google.genai import types
client = genai.Client()
# After starting the job, you get an operation object.
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt="A cinematic shot of a majestic lion in the savannah.",
)
# Alternatively, you can use operation.name to get the operation.
operation = types.GenerateVideosOperation(name=operation.name)
# This loop checks the job status every 10 seconds.
while not operation.done:
time.sleep(10)
# Refresh the operation object to get the latest status.
operation = client.operations.get(operation)
# Once done, the result is in operation.response.
# ... process and download your video ...
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
// After starting the job, you get an operation object.
let operation = await ai.models.generateVideos({
model: "veo-3.1-generate-preview",
prompt: "A cinematic shot of a majestic lion in the savannah.",
});
// Alternatively, you can use operation.name to get the operation.
// operation = types.GenerateVideosOperation(name=operation.name)
// This loop checks the job status every 10 seconds.
while (!operation.done) {
await new Promise((resolve) => setTimeout(resolve, 1000));
// Refresh the operation object to get the latest status.
operation = await ai.operations.getVideosOperation({ operation });
}
// Once done, the result is in operation.response.
// ... process and download your video ...
پارامترها و مشخصات API Veo
اینها پارامترهایی هستند که میتوانید در درخواست API خود برای کنترل فرآیند تولید ویدیو تنظیم کنید.
پارامتر | توضیحات | ویو ۳.۱ و ویو ۳.۱ سریع | ویو ۳ و ویو ۳ فست | وئو ۲ |
---|---|---|---|---|
prompt | توضیحات متنی برای ویدیو. پشتیبانی از نشانههای صوتی. | string | string | string |
negativePrompt | متنی که توضیح میدهد چه چیزهایی را نباید در ویدیو بگنجانید. | string | string | string |
image | یک تصویر اولیه برای متحرکسازی. | شیء Image | شیء Image | شیء Image |
lastFrame | تصویر نهایی برای انتقال ویدیوی درونیابی. باید در ترکیب با پارامتر image استفاده شود. | شیء Image | شیء Image | شیء Image |
referenceImages | حداکثر سه تصویر به عنوان مرجع سبک و محتوا استفاده شود. | شیء VideoGenerationReferenceImage (فقط در نسخه 3.1) | ناموجود | ناموجود |
video | ویدیویی که قرار است برای افزونه ویدیویی استفاده شود. | شیء Video | ناموجود | ناموجود |
aspectRatio | نسبت ابعاد ویدیو. | "16:9" (پیشفرض، ۷۲۰p و ۱۰۸۰p)،"9:16" (۷۲۰p و ۱۰۸۰p) | "16:9" (پیشفرض، ۷۲۰p و ۱۰۸۰p)،"9:16" (۷۲۰p و ۱۰۸۰p) | "16:9" (پیشفرض، ۷۲۰p)،"9:16" (۷۲۰p) |
resolution | نسبت ابعاد ویدیو. | "720p" (پیشفرض)،"1080p" (فقط از مدت زمان ۸ ثانیه پشتیبانی میکند)"720p" فقط برای افزونه | "720p" (پیشفرض)،"1080p" (فقط ۱۶:۹) | پشتیبانی نشده |
durationSeconds | مدت زمان ویدیوی تولید شده. | "4" ، "6" ، "8" .هنگام استفاده از بسط یا درونیابی (پشتیبانی از هر دو نسبت تصویر ۱۶:۹ و ۹:۱۶) و هنگام استفاده از referenceImages (فقط پشتیبانی از ۱۶:۹) باید "۸" باشد. | "4" ، "6" ، "8" | "5" ، "6" ، "8" |
personGeneration | نسل انسان را کنترل میکند. (برای محدودیتهای منطقهای به محدودیتها مراجعه کنید) | تبدیل متن به ویدیو و افزونه: فقط "allow_all" تبدیل تصویر به ویدیو، درونیابی و تصاویر مرجع: فقط "allow_adult" | تبدیل متن به ویدیو: فقط "allow_all" تبدیل تصویر به ویدیو: فقط "allow_adult" | تبدیل متن به ویدیو:"allow_all" ، "allow_adult" ، "dont_allow" تبدیل تصویر به ویدیو: "allow_adult" و "dont_allow" |
توجه داشته باشید که پارامتر seed
برای مدلهای Veo 3 نیز موجود است. این پارامتر قطعیت را تضمین نمیکند، اما آن را کمی بهبود میبخشد.
شما میتوانید با تنظیم پارامترها در درخواست خود، تولید ویدیوی خود را سفارشی کنید. برای مثال، میتوانید negativePrompt
برای هدایت مدل مشخص کنید.
پایتون
import time
from google import genai
from google.genai import types
client = genai.Client()
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt="A cinematic shot of a majestic lion in the savannah.",
config=types.GenerateVideosConfig(negative_prompt="cartoon, drawing, low quality"),
)
# Poll the operation status until the video is ready.
while not operation.done:
print("Waiting for video generation to complete...")
time.sleep(10)
operation = client.operations.get(operation)
# Download the generated video.
generated_video = operation.response.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("parameters_example.mp4")
print("Generated video saved to parameters_example.mp4")
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
let operation = await ai.models.generateVideos({
model: "veo-3.1-generate-preview",
prompt: "A cinematic shot of a majestic lion in the savannah.",
config: {
aspectRatio: "16:9",
negativePrompt: "cartoon, drawing, low quality"
},
});
// Poll the operation status until the video is ready.
while (!operation.done) {
console.log("Waiting for video generation to complete...")
await new Promise((resolve) => setTimeout(resolve, 10000));
operation = await ai.operations.getVideosOperation({
operation: operation,
});
}
// Download the generated video.
ai.files.download({
file: operation.response.generatedVideos[0].video,
downloadPath: "parameters_example.mp4",
});
console.log(`Generated video saved to parameters_example.mp4`);
برو
package main
import (
"context"
"log"
"os"
"time"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
videoConfig := &genai.GenerateVideosConfig{
AspectRatio: "16:9",
NegativePrompt: "cartoon, drawing, low quality",
}
operation, _ := client.Models.GenerateVideos(
ctx,
"veo-3.1-generate-preview",
"A cinematic shot of a majestic lion in the savannah.",
nil,
videoConfig,
)
// Poll the operation status until the video is ready.
for !operation.Done {
log.Println("Waiting for video generation to complete...")
time.Sleep(10 * time.Second)
operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
}
// Download the generated video.
video := operation.Response.GeneratedVideos[0]
client.Files.Download(ctx, video.Video, nil)
fname := "parameters_example.mp4"
_ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
log.Printf("Generated video saved to %s\n", fname)
}
استراحت
# Note: This script uses jq to parse the JSON response.
# GEMINI API Base URL
BASE_URL="https://generativelanguage.googleapis.com/v1beta"
# Send request to generate video and capture the operation name into a variable.
operation_name=$(curl -s "${BASE_URL}/models/veo-3.1-generate-preview:predictLongRunning" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X "POST" \
-d '{
"instances": [{
"prompt": "A cinematic shot of a majestic lion in the savannah."
}
],
"parameters": {
"aspectRatio": "16:9",
"negativePrompt": "cartoon, drawing, low quality"
}
}' | jq -r .name)
# Poll the operation status until the video is ready
while true; do
# Get the full JSON status and store it in a variable.
status_response=$(curl -s -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${operation_name}")
# Check the "done" field from the JSON stored in the variable.
is_done=$(echo "${status_response}" | jq .done)
if [ "${is_done}" = "true" ]; then
# Extract the download URI from the final response.
video_uri=$(echo "${status_response}" | jq -r '.response.generateVideoResponse.generatedSamples[0].video.uri')
echo "Downloading video from: ${video_uri}"
# Download the video using the URI and API key and follow redirects.
curl -L -o parameters_example.mp4 -H "x-goog-api-key: $GEMINI_API_KEY" "${video_uri}"
break
fi
# Wait for 5 seconds before checking again.
sleep 10
done
راهنمای سریع Veo
این بخش شامل نمونههایی از ویدیوهایی است که میتوانید با استفاده از Veo ایجاد کنید و به شما نشان میدهد که چگونه میتوانید اعلانها را برای تولید نتایج متمایز تغییر دهید.
فیلترهای ایمنی
وئو فیلترهای ایمنی را در سراسر جمینی اعمال میکند تا اطمینان حاصل شود که ویدیوهای تولید شده و عکسهای آپلود شده حاوی محتوای توهینآمیز نیستند. اعلانهایی که شرایط و ضوابط ما را نقض میکنند، مسدود میشوند.
اصول اولیه نوشتن سریع
پیشنهادهای خوب، توصیفی و واضح هستند. برای اینکه بیشترین بهره را از Veo ببرید، با شناسایی ایده اصلی خود شروع کنید، ایده خود را با اضافه کردن کلمات کلیدی و اصلاحکنندهها اصلاح کنید و اصطلاحات خاص ویدیو را در پیشنهادهای خود بگنجانید.
عناصر زیر باید در درخواست شما گنجانده شوند:
- موضوع : شیء، شخص، حیوان یا منظرهای که میخواهید در ویدیوی شما باشد، مانند منظره شهری ، طبیعت ، وسایل نقلیه یا توله سگها .
- عمل : کاری که سوژه انجام میدهد (مثلاً راه رفتن ، دویدن یا چرخاندن سر ).
- سبک : جهتگیری خلاقانه را با استفاده از کلمات کلیدی خاص سبک فیلم، مانند علمی تخیلی ، فیلم ترسناک ، فیلم نوآر یا سبکهای انیمیشن مانند کارتون ، مشخص کنید.
- موقعیت و حرکت دوربین : [اختیاری] موقعیت و حرکت دوربین را با استفاده از عباراتی مانند نمای هوایی ، تراز چشم ، نمای بالا به پایین ، نمای دالی یا نمای کرمی کنترل کنید.
- ترکیببندی : [اختیاری] نحوهی قاببندی نما، مانند نمای باز ، نمای نزدیک ، تکعکس یا دوعکس .
- فوکوس و جلوههای لنز : [اختیاری] برای دستیابی به جلوههای بصری خاص، از اصطلاحاتی مانند فوکوس سطحی ، فوکوس عمیق ، فوکوس نرم ، لنز ماکرو و لنز واید استفاده کنید.
- محیط : [اختیاری] نحوهی تأثیرگذاری رنگ و نور بر صحنه، مانند تُنهای آبی ، شب یا تُنهای گرم .
نکات بیشتر برای نوشتن سوالات امتحانی
- از زبان توصیفی استفاده کنید : از صفتها و قیدها برای ترسیم تصویری واضح از Veo استفاده کنید.
- جزئیات صورت را برجسته کنید : جزئیات صورت را به عنوان نقطه کانونی عکس مشخص کنید، مثلاً از کلمه پرتره در سوال استفاده کنید.
برای استراتژیهای جامعتر برای ایجاد انگیزه، به مقدمهای بر طراحی انگیزه مراجعه کنید.
درخواست صدا
با Veo 3، میتوانید نشانههایی برای جلوههای صوتی، نویز محیط و دیالوگ ارائه دهید. این مدل، ظرافت این نشانهها را برای تولید موسیقی متن هماهنگ ضبط میکند.
- گفتگو: از نقل قول برای گفتار خاص استفاده کنید. (مثال: او زمزمه کرد: «این باید کلید باشد.»)
- جلوههای صوتی (SFX): صداها را به طور واضح توصیف کنید. (مثال: صدای جیغ لاستیکها، غرش موتور.)
- سر و صدای محیط: منظره صوتی محیط را توصیف کنید. (مثال: صدای زمزمهای ضعیف و وهمآور در پسزمینه طنینانداز میشود.)
این ویدیوها، تولید صدای Veo 3 را با سطوح فزایندهای از جزئیات نشان میدهند.
سریع | خروجی تولید شده |
---|---|
جزئیات بیشتر (دیالوگ و فضاسازی) نمای باز از جنگلی مهآلود در شمال غربی اقیانوس آرام. دو کوهنورد خسته، یک مرد و یک زن، در میان سرخسها به پیش میروند که ناگهان مرد میایستد و به درختی خیره میشود. نمای نزدیک: جای پنجههای تازه و عمیق روی پوست درخت کنده شده است. مرد: (دستش روی چاقوی شکارش است) "این خرس معمولی نیست." زن: (با صدایی گرفته از ترس، در حالی که جنگل را بررسی میکند) "پس چیست؟" صدای پارس خشن، شکستن شاخهها، صدای قدمهایی روی زمین مرطوب. صدای جیکجیک یک پرنده تنها. | ![]() |
جزئیات کمتر (دیالوگ) انیمیشن برش کاغذ. کتابدار جدید: «کتابهای ممنوعه را کجا نگه میدارید؟» متصدی قدیمی: «ما این کار را نمیکنیم. آنها ما را نگه میدارند.» | ![]() |
برای شنیدن صدا، خودتان این سوالات را امتحان کنید! Veo 3 را امتحان کنید.
راهنمایی با تصاویر مرجع
شما میتوانید با استفاده از قابلیتهای تبدیل تصویر به ویدیو در Veo، از یک یا چند تصویر به عنوان ورودی برای هدایت ویدیوهای تولید شده خود استفاده کنید. Veo از تصویر ورودی به عنوان فریم اولیه استفاده میکند. تصویری را که به آنچه به عنوان اولین صحنه ویدیوی خود تصور میکنید، نزدیکتر است انتخاب کنید تا اشیاء روزمره را متحرک کنید، به نقاشیها و طرحها جان ببخشید و به صحنههای طبیعت حرکت و صدا اضافه کنید.
سریع | خروجی تولید شده |
---|---|
تصویر ورودی (تولید شده توسط نانو موز) یک عکس ماکروی فوق واقعی از موجسواران کوچک و مینیاتوری که در حال موجسواری در امواج اقیانوس درون یک سینک حمام سنگی روستیک هستند. یک شیر آب برنجی قدیمی در حال اجرا است و موجهای دائمی را ایجاد میکند. نورپردازی طبیعی سورئال، خیالانگیز و درخشان. | ![]() |
خروجی ویدیو (تولید شده توسط Veo 3.1) یک ویدیوی ماکروی سورئال و سینمایی. موجسواران کوچک در یک سینک سنگی حمام، موجهای دائمی و غلتان را میرانند. یک شیر آب برنجی قدیمی، موجهای بیپایان را خلق میکند. دوربین به آرامی در صحنهی خیالانگیز و روشن از آفتاب حرکت میکند، در حالی که این موجودات مینیاتوری ماهرانه آب فیروزهای را تراش میدهند. | ![]() |
Veo 3.1 به شما امکان میدهد تصاویر یا مواد اولیه را برای هدایت محتوای ویدیوی تولید شده خود ارجاع دهید. حداکثر سه تصویر از یک شخص، شخصیت یا محصول ارائه دهید. Veo ظاهر سوژه را در ویدیوی خروجی حفظ میکند.
سریع | خروجی تولید شده |
---|---|
تصویر مرجع (تولید شده توسط نانو موز) یک ماهی قلابچه ماهی در اعماق آبهای تاریک، با دندانهای نمایان و طعمه درخشان، کمین کرده است. | ![]() |
تصویر مرجع (تولید شده توسط نانو موز) یک لباس پرنسسی کودک صورتی رنگ به همراه عصا و تاج، روی زمینه ساده محصول. | ![]() |
خروجی ویدیو (تولید شده توسط Veo 3.1) یک نسخه کارتونی بامزه از ماهی که لباس مخصوص را پوشیده، شنا میکند و چوب جادو را تکان میدهد، درست کنید. | ![]() |
با استفاده از Veo 3.1، میتوانید با مشخص کردن اولین و آخرین فریمهای ویدیو، ویدیو تولید کنید.
سریع | خروجی تولید شده |
---|---|
تصویر اول (تولید شده توسط نانو موز) یک تصویر واقعی با کیفیت بالا از یک گربه مو قرمز که در حال راندن یک ماشین مسابقهای کروک قرمز در ساحل ریویرای فرانسه است. | ![]() |
تصویر آخر (تولید شده توسط نانو موز) نشان دهید وقتی ماشین از صخره بلند میشود چه اتفاقی میافتد. | ![]() |
خروجی ویدیو (تولید شده توسط Veo 3.1) اختیاری | ![]() |
این ویژگی با امکان تعریف فریم شروع و پایان، کنترل دقیقی بر ترکیببندی تصویر به شما میدهد. یک تصویر آپلود کنید یا از یک فریم از نسل قبلی ویدیو استفاده کنید تا مطمئن شوید صحنه شما دقیقاً همانطور که تصور میکنید شروع و پایان مییابد.
درخواست تمدید
برای گسترش ویدیوی تولید شده توسط Veo خود با Veo 3.1، از ویدیو به عنوان ورودی به همراه یک متن اختیاری استفاده کنید. Extend ثانیه آخر یا 24 فریم ویدیوی شما را نهایی میکند و عملیات را ادامه میدهد.
توجه داشته باشید که اگر صدا در ۱ ثانیه آخر ویدیو وجود نداشته باشد، نمیتوان آن را به طور مؤثر گسترش داد.
سریع | خروجی تولید شده |
---|---|
ویدیوی ورودی (تولید شده توسط Veo 3.1) پاراگلایدر از بالای کوه بلند میشود و شروع به سر خوردن از کوهها میکند و مشرف به درههای پوشیده از گل در پایین است. | ![]() |
خروجی ویدیو (تولید شده توسط Veo 3.1) این ویدیو را با پاراگلایدر که به آرامی در حال پایین آمدن است، ادامه دهید. | ![]() |
مثالهای درخواست و خروجی
این بخش چندین نکته را ارائه میدهد و نشان میدهد که چگونه جزئیات توصیفی میتوانند نتیجه هر ویدیو را ارتقا دهند.
قندیلها
این ویدیو نشان میدهد که چگونه میتوانید از عناصر اصول اولیه نگارش سریع در متن خود استفاده کنید.
سریع | خروجی تولید شده |
---|---|
نمای نزدیک (ترکیببندی) از قندیلهای یخی در حال ذوب (سوژه) روی دیوار سنگی یخزده (زمینه) با تُنهای آبی سرد (فضا)، بزرگنمایی (حرکت دوربین) با حفظ جزئیات نمای نزدیک از قطرات آب (کنش). | ![]() |
مرد پشت تلفن
این ویدیوها نشان میدهند که چگونه میتوانید درخواست خود را با جزئیات دقیقتر اصلاح کنید تا Veo خروجی را مطابق میل شما اصلاح کند.
سریع | خروجی تولید شده |
---|---|
جزئیات کمتر دوربین برای نشان دادن نمای نزدیکی از مردی درمانده با پالتوی سبزرنگ، روی صفحه نمایش حرکت میکند. او در حال برقراری تماس با تلفن دیواری چرخشی با چراغ نئون سبز است. این صحنه شبیه صحنهای از یک فیلم است. | ![]() |
جزئیات بیشتر یک نمای نزدیک سینمایی، مردی ناامید را با پالتوی سبز کهنه در حالی که با تلفن چرخشی نصب شده روی دیوار آجری ناهموار، غرق در درخشش وهمآور یک تابلوی نئون سبز، شماره میگیرد، دنبال میکند. دوربین به آرامی وارد میشود و تنش در فک او و ناامیدی حک شده بر چهرهاش را در حالی که برای برقراری تماس تقلا میکند، نشان میدهد. عمق میدان کم بر ابروهای درهم کشیده و تلفن چرخشی سیاه متمرکز شده و پسزمینه را در دریایی از رنگهای نئونی و سایههای نامشخص محو میکند و حس فوریت و انزوا را ایجاد میکند. | ![]() |
پلنگ برفی
سریع | خروجی تولید شده |
---|---|
دستور ساده: یک موجود بامزه با خزی شبیه پلنگ برفی در جنگل زمستانی قدم میزند، رندر به سبک کارتونی سهبعدی. | ![]() |
دستورالعمل تفصیلی: یک صحنه انیمیشن سه بعدی کوتاه به سبک کارتونی شاد ایجاد کنید. موجودی بامزه با خز پلنگ برفی، چشمان بزرگ و رسا و اندامی دوستانه و گرد، با خوشحالی در یک جنگل زمستانی خیالانگیز قدم میزند. این صحنه باید شامل درختان گرد و پوشیده از برف، دانههای برف ملایم در حال ریزش و نور گرم خورشید که از میان شاخهها عبور میکند، باشد. حرکات پرشی و لبخند پهن موجود باید لذت خالص را منتقل کند. سعی کنید لحنی شاد و دلگرمکننده با رنگهای روشن و شاد و انیمیشنی بازیگوشانه داشته باشید. | ![]() |
مثالها با نوشتن عناصر
این مثالها به شما نشان میدهند که چگونه میتوانید سوالات خود را بر اساس هر عنصر اساسی اصلاح کنید.
موضوع و زمینه
تمرکز اصلی (موضوع) و پسزمینه یا محیط (زمینه) را مشخص کنید.
سریع | خروجی تولید شده |
---|---|
یک رندر معماری از یک آپارتمان بتنی سفید با اشکال ارگانیک روان، که به طور یکپارچه با فضای سبز سرسبز و عناصر آیندهنگر ترکیب شده است. | ![]() |
ماهوارهای که در فضا شناور است و ماه و چند ستاره در پسزمینه دیده میشوند. | ![]() |
اکشن
مشخص کنید که سوژه چه کاری انجام میدهد (مثلاً راه میرود، میدود یا سرش را میچرخاند).
سریع | خروجی تولید شده |
---|---|
نمایی باز از زنی که در امتداد ساحل قدم میزند، با نگاهی راضی و آرام به افق در هنگام غروب آفتاب. | ![]() |
سبک
کلمات کلیدی را اضافه کنید تا نسل را به سمت یک زیباییشناسی خاص هدایت کنید (مثلاً سورئال، وینتیج، فوتوریستی، فیلم نوآر).
سریع | خروجی تولید شده |
---|---|
سبک فیلم نوآر، مرد و زن در خیابان قدم میزنند، معمایی، سینمایی، سیاه و سفید. | ![]() |
حرکت دوربین و ترکیببندی
نحوه حرکت دوربین (نمای POV، نمای هوایی، نمای پهپاد در حال تعقیب) و نحوه قاببندی نما (نمای باز، نمای نزدیک، نمای پایین) را مشخص کنید.
سریع | خروجی تولید شده |
---|---|
نمای زاویه دید از داخل یک ماشین قدیمی که زیر باران رانندگی میکند، کانادا در شب، سینمایی. | ![]() |
نمای بسیار نزدیک از یک چشم که شهر در آن منعکس شده است. | ![]() |
محیط
پالتهای رنگی و نورپردازی بر حال و هوا تأثیر میگذارند. اصطلاحاتی مانند «رنگهای گرم نارنجی ملایم»، «نور طبیعی»، «طلوع آفتاب» یا «رنگهای آبی سرد» را امتحان کنید.
سریع | خروجی تولید شده |
---|---|
نمای نزدیک از دختری که توله سگ گلدن رتریور دوست داشتنی را در پارک در آغوش گرفته است، در حالی که نور خورشید میتابد. | ![]() |
نمای نزدیک سینمایی از زنی غمگین که در باران سوار اتوبوس است، تُنهای آبی سرد، حال و هوای غمگین. | ![]() |
پیامهای منفی
پیامهای منفی، عناصری را که نمیخواهید در ویدیو باشند، مشخص میکنند.
- ❌ از زبان دستوری مانند «نه» یا «نکن » استفاده نکنید (مثلاً «دیوار ممنوع»).
- ✅ حتماً چیزی را که نمیخواهید ببینید توصیف کنید. (مثلاً «دیوار، قاب»).
سریع | خروجی تولید شده |
---|---|
بدون اشاره منفی: یک انیمیشن کوتاه و سبکدار از یک درخت بلوط بزرگ و تنها با برگهایی که در باد شدید به شدت تکان میخورند، بسازید... [کوتاه شده] | ![]() |
با پیشنهاد منفی: [همان درخواست] محرک منفی: پسزمینه شهری، سازههای ساخته دست بشر، فضای تاریک، طوفانی یا تهدیدآمیز. | ![]() |
نسبتهای ابعاد
Veo به شما امکان میدهد نسبت ابعاد ویدیوی خود را مشخص کنید.
سریع | خروجی تولید شده |
---|---|
صفحه عریض (16:9) با استفاده از یک پهپاد ردیابی، ویدیویی از مردی که در حال رانندگی با یک ماشین کروک قرمز در پالم اسپرینگز، دهه ۱۹۷۰ است، با نور گرم خورشید و سایههای بلند، بسازید. | ![]() |
پرتره (۹:۱۶) ویدیویی بسازید که حرکت روان یک آبشار باشکوه هاوایی را در دل یک جنگل بارانی سرسبز برجسته کند. برای انتقال آرامش، روی جریان آب واقعگرایانه، شاخ و برگهای دقیق و نورپردازی طبیعی تمرکز کنید. آب خروشان، فضای مهآلود و نور خورشید لکهدار را که از میان سایبان انبوه عبور میکند، به تصویر بکشید. از حرکات نرم و سینمایی دوربین برای نمایش آبشار و محیط اطراف آن استفاده کنید. سعی کنید لحنی آرام و واقعگرایانه داشته باشید و بیننده را به زیبایی آرام جنگل بارانی هاوایی منتقل کنید. | ![]() |
محدودیتها
- تأخیر درخواست: حداقل: ۱۱ ثانیه؛ حداکثر: ۶ دقیقه (در ساعات اوج مصرف).
- محدودیتهای منطقهای: در کشورهای عضو اتحادیه اروپا، بریتانیا، جمهوری خلق چین و خاورمیانه و شمال آفریقا، مقادیر مجاز برای
personGeneration
به شرح زیر است:- نسخه ۳: فقط
allow_adult
. - نسخه ۲:
dont_allow
وallow_adult
. مقدار پیشفرضdont_allow
است.
- نسخه ۳: فقط
- نگهداری ویدیو: ویدیوهای تولید شده به مدت ۲ روز در سرور ذخیره میشوند و پس از آن حذف میشوند. برای ذخیره یک نسخه محلی، باید ویدیوی خود را ظرف ۲ روز پس از تولید دانلود کنید. ویدیوهای توسعهیافته به عنوان ویدیوهای تازه تولید شده در نظر گرفته میشوند.
- واترمارک: ویدیوهای ساخته شده توسط Veo با استفاده از SynthID ، ابزار ما برای واترمارک و شناسایی محتوای تولید شده توسط هوش مصنوعی، واترمارک میشوند. ویدیوها را میتوان با استفاده از پلتفرم تأیید SynthID تأیید کرد.
- ایمنی: ویدیوهای تولید شده از فیلترهای ایمنی و فرآیندهای بررسی حافظه عبور داده میشوند که به کاهش خطرات مربوط به حریم خصوصی، حق چاپ و تعصب کمک میکند.
- خطای صوتی: Veo 3.1 گاهی اوقات به دلیل فیلترهای ایمنی یا سایر مشکلات پردازش صدا، مانع از تولید ویدیو میشود. در صورت مسدود شدن تولید ویدیوی شما، هزینهای از شما دریافت نخواهد شد.
ویژگیهای مدل
ویژگی | توضیحات | ویو ۳.۱ و ویو ۳.۱ سریع | ویو ۳ و ویو ۳ فست | وئو ۲ |
---|---|---|---|---|
صوتی | به صورت بومی صدا را با ویدیو تولید میکند. | به صورت بومی صدا را با ویدیو تولید میکند. | ✔️ همیشه روشن | ❌ فقط بیصدا |
روشهای ورودی | نوع ورودی مورد استفاده برای تولید. | تبدیل متن به ویدیو، تصویر به ویدیو، ویدیو به ویدیو | تبدیل متن به ویدیو، تبدیل تصویر به ویدیو | تبدیل متن به ویدیو، تبدیل تصویر به ویدیو |
وضوح تصویر | وضوح خروجی ویدیو. | ۷۲۰p و ۱۰۸۰p (فقط مدت زمان ۸ ثانیه) فقط هنگام استفاده از افزونه ویدیویی، کیفیت 720p ارائه میشود. | 720p و 1080p (فقط 16:9) | ۷۲۰p |
نرخ فریم | نرخ فریم خروجی ویدیو. | ۲۴ فریم در ثانیه | ۲۴ فریم در ثانیه | ۲۴ فریم در ثانیه |
مدت زمان ویدیو | مدت زمان ویدیوی تولید شده. | ۸ ثانیه، ۶ ثانیه، ۴ ثانیه فقط ۸ ثانیه هنگام استفاده از تصاویر مرجع | ۸ ثانیه | ۵-۸ ثانیه |
ویدیوها به ازای هر درخواست | تعداد ویدیوهای تولید شده به ازای هر درخواست. | ۱ | ۱ | ۱ یا ۲ |
وضعیت و جزئیات | موجودی مدل و جزئیات بیشتر | پیشنمایش | پایدار | پایدار |
نسخههای مدل
برای جزئیات بیشتر در مورد استفاده از مدلهای خاص Veo، به صفحات قیمتگذاری و محدودیتهای نرخ مراجعه کنید.
پیشنمایش ویو ۳.۱
ملک | توضیحات |
---|---|
کد مدل | رابط برنامهنویسی کاربردی Gemini |
انواع داده پشتیبانی شده را | ورودی متن، تصویر خروجی ویدئو با صدا |
ورودی متن ۱,۰۲۴ توکن خروجی ویدئو ۱ | |
آخرین بهروزرسانی | سپتامبر ۲۰۲۵ |
پیشنمایش سریع Veo 3.1
ملک | توضیحات |
---|---|
کد مدل | رابط برنامهنویسی کاربردی Gemini |
انواع داده پشتیبانی شده را | ورودی متن، تصویر خروجی ویدئو با صدا |
ورودی متن ۱,۰۲۴ توکن خروجی ویدئو ۱ | |
آخرین بهروزرسانی | سپتامبر ۲۰۲۵ |
وئو ۳
ملک | توضیحات |
---|---|
کد مدل | رابط برنامهنویسی کاربردی Gemini |
انواع داده پشتیبانی شده را | ورودی متن، تصویر خروجی ویدئو با صدا |
ورودی متن ۱,۰۲۴ توکن خروجی ویدئو ۱ | |
آخرین بهروزرسانی | ژوئیه ۲۰۲۵ |
وئو ۳ سریع
Veo 3 Fast به توسعهدهندگان اجازه میدهد تا ویدیوهایی با صدا بسازند و در عین حال کیفیت بالا را حفظ کرده و برای سرعت و موارد استفاده تجاری بهینه کنند. این ابزار برای سرویسهای backend که به صورت برنامهنویسی شده تبلیغات تولید میکنند، ابزارهایی برای تست سریع A/B از مفاهیم خلاقانه یا برنامههایی که نیاز به تولید سریع محتوای رسانههای اجتماعی دارند، ایدهآل است.ملک | توضیحات |
---|---|
کد مدل | رابط برنامهنویسی کاربردی Gemini |
انواع داده پشتیبانی شده را | ورودی متن، تصویر خروجی ویدئو با صدا |
ورودی متن ۱,۰۲۴ توکن خروجی ویدئو ۱ | |
آخرین بهروزرسانی | ژوئیه ۲۰۲۵ |
وئو ۲
ملک | توضیحات |
---|---|
کد مدل | رابط برنامهنویسی کاربردی Gemini |
انواع داده پشتیبانی شده را | ورودی متن، تصویر خروجی ویدئو |
ورودی متن ناموجود ورودی تصویر هر وضوح تصویر و نسبت ابعادی تا حجم فایل ۲۰ مگابایت خروجی ویدئو تا ۲ | |
آخرین بهروزرسانی | آوریل ۲۰۲۵ |
قدم بعدی چیست؟
- با آزمایش در Veo Quickstart Colab و اپلت Veo 3.1 ، کار با رابط برنامهنویسی کاربردی (API) Veo 3.1 را آغاز کنید.
- با «مقدمهای بر طراحی سریع» یاد بگیرید که چگونه دستورالعملهای بهتری بنویسید.