Tạo video bằng Veo

API Gemini cung cấp quyền truy cập vào Veo 2, mô hình tạo video mạnh nhất của Google cho đến nay. Veo tạo video với nhiều phong cách hình ảnh và điện ảnh, nắm bắt được các sắc thái nhanh chóng để hiển thị các chi tiết phức tạp một cách nhất quán trên các khung hình. Hướng dẫn này sẽ giúp bạn bắt đầu sử dụng Veo bằng Gemini API.

Để biết hướng dẫn về câu lệnh trong video, hãy xem phần Hướng dẫn về câu lệnh của Veo.

Trước khi bắt đầu

Trước khi gọi Gemini API, hãy đảm bảo bạn đã cài đặt SDK mà bạn chọnkhoá Gemini API đã được định cấu hình và sẵn sàng sử dụng.

Để sử dụng Veo với các SDK AI thế hệ mới của Google, hãy đảm bảo bạn đã cài đặt một trong các phiên bản sau:

Tạo video

Phần này cung cấp các mã ví dụ để tạo video bằng câu lệnh văn bảnsử dụng hình ảnh.

Tạo từ văn bản

Bạn có thể sử dụng mã sau để tạo video bằng Veo:

import time
from google import genai
from google.genai import types

client = genai.Client()  # read API key from GOOGLE_API_KEY

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="dont_allow",  # "dont_allow" or "allow_adult"
        aspect_ratio="16:9",  # "16:9" or "9:16"
    ),
)

while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)

for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # save the video

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    config: {
      personGeneration: "dont_allow",
      aspectRatio: "16:9",
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(`${generatedVideo.video?.uri}&key=GOOGLE_API_KEY`); // append your API key
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();
package main

import (
  "context"
  "fmt"
  "os"
  "time"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:      "16:9",
      PersonGeneration: "dont_allow",
  }

  operation, _ := client.Models.GenerateVideos(
      ctx,
      "veo-2.0-generate-001",
      "Panning wide shot of a calico kitten sleeping in the sunshine",
      nil,
      videoConfig,
  )

  for !operation.Done {
      time.Sleep(20 * time.Second)
      operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
  }

  for n, video := range operation.Response.GeneratedVideos {
      client.Files.Download(ctx, video.Video, nil)
      fname := fmt.Sprintf("video_%d.mp4", n)
      _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
  }
}
# Use curl to send a POST request to the predictLongRunning endpoint.
# The request body includes the prompt for video generation.
curl "${BASE_URL}/models/veo-2.0-generate-001:predictLongRunning?key=${GOOGLE_API_KEY}" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "Panning wide shot of a calico kitten sleeping in the sunshine"
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "personGeneration": "dont_allow",
    }
  }' | tee result.json | jq .name | sed 's/"//g' > op_name

# Obtain operation name to download video.
op_name=$(cat op_name)

# Check against status of operation.
while true; do
  is_done=$(curl "${BASE_URL}/${op_name}?key=${GOOGLE_API_KEY}" | tee op_check.json | jq .done)

  if [ "${is_done}" = "true" ]; then
    cat op_check.json
    echo "** Attach API_KEY to download video, or examine error message."
    break
  fi

  echo "** Video ${op_name} has not downloaded yet!  Check again after 5 seconds..."

  # Wait for 5 seoncds to check again.
  sleep 5

done

Mèo con đang ngủ dưới ánh nắng.

Mã này mất khoảng 2-3 phút để chạy, mặc dù có thể mất nhiều thời gian hơn nếu tài nguyên bị hạn chế. Sau khi quá trình chạy hoàn tất, bạn sẽ thấy một video có dạng như sau:

Nếu bạn thấy thông báo lỗi thay vì video, thì tức là tài nguyên bị hạn chế và bạn không thể hoàn tất yêu cầu. Trong trường hợp này, hãy chạy lại mã.

Các video đã tạo sẽ được lưu trữ trên máy chủ trong 2 ngày, sau đó sẽ bị xoá. Nếu muốn lưu bản sao cục bộ của video đã tạo, bạn phải chạy result()save() trong vòng 2 ngày kể từ khi tạo.

Tạo từ hình ảnh

Bạn cũng có thể tạo video bằng hình ảnh. Mã sau đây sẽ tạo một hình ảnh bằng Imagen, sau đó sử dụng hình ảnh đã tạo làm khung bắt đầu cho video đã tạo.

Trước tiên, hãy tạo một hình ảnh bằng Imagen:

prompt="Panning wide shot of a calico kitten sleeping in the sunshine",

imagen = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(
      aspect_ratio="16:9",
      number_of_images=1
    )
)

imagen.generated_images[0].image
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
const response = await ai.models.generateImages({
  model: "imagen-3.0-generate-002",
  prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
  config: {
    numberOfImages: 1,
  },
});

// you'll pass response.generatedImages[0].image.imageBytes to Veo
package main

import (
    "context"
    "fmt"
    "os"
    "time"
    "google.golang.org/genai"
)

func main() {

    ctx := context.Background()
    client, _ := genai.NewClient(ctx, &genai.ClientConfig{
        APIKey:  os.Getenv("GEMINI_API_KEY"),
        Backend: genai.BackendGeminiAPI,
    })

    config := &genai.GenerateImagesConfig{
        AspectRatio:    "16:9",
        NumberOfImages: 1,
    }

    response, _ := client.Models.GenerateImages(
        ctx,
        "imagen-3.0-generate-002",
        "Panning wide shot of a calico kitten sleeping in the sunshine",
        config,
    )

    // you'll pass response.GeneratedImages[0].Image to Veo
}

Sau đó, tạo một video bằng cách sử dụng hình ảnh thu được làm khung đầu tiên:

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt=prompt,
    image = imagen.generated_images[0].image,
    config=types.GenerateVideosConfig(
      # person_generation is not allowed for image-to-video generation
      aspect_ratio="16:9",  # "16:9" or "9:16"
      number_of_videos=2
    ),
)

# Wait for videos to generate
 while not operation.done:
  time.sleep(20)
  operation = client.operations.get(operation)

for n, video in enumerate(operation.response.generated_videos):
    fname = f'with_image_input{n}.mp4'
    print(fname)
    client.files.download(file=video.video)
    video.video.save(fname)
import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  // get image bytes from Imagen, as shown above

  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    image: {
      imageBytes: response.generatedImages[0].image.imageBytes, // response from Imagen
      mimeType: "image/png",
    },
    config: {
      aspectRatio: "16:9",
      numberOfVideos: 2,
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(
      `${generatedVideo.video?.uri}&key=GOOGLE_API_KEY`, // append your API key
    );
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();
    image := response.GeneratedImages[0].Image

    videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:    "16:9",
      NumberOfVideos: 2,
    }

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-2.0-generate-001",
        "A dramatic scene based on the input image",
        image,
        videoConfig,
    )

    for !operation.Done {
        time.Sleep(20 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    for n, video := range operation.Response.GeneratedVideos {
        client.Files.Download(ctx, video.Video, nil)
        fname := fmt.Sprintf("video_with_image_input_%d.mp4", n)
        _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    }
}

Tham số mô hình Veo

(Quy ước đặt tên thay đổi tuỳ theo ngôn ngữ lập trình.)

  • prompt: Lời nhắc bằng văn bản cho video. Khi có, tham số image là không bắt buộc.
  • image: Hình ảnh dùng làm khung hình đầu tiên của video. Khi có, tham số prompt là không bắt buộc.
  • negativePrompt: Chuỗi văn bản mô tả mọi nội dung bạn muốn ngăn cản mô hình tạo ra
  • aspectRatio: Thay đổi tỷ lệ khung hình của video đã tạo. Các giá trị được hỗ trợ là "16:9""9:16". Giá trị mặc định là "16:9".
  • personGeneration: Cho phép mô hình tạo video có mặt mọi người. Những giá trị sau đây được hỗ trợ:
    • Tạo chuyển văn bản sang video:
      • "dont_allow": Không cho phép thêm người hoặc khuôn mặt.
      • "allow_adult": Tạo video có người lớn nhưng không có trẻ em.
    • Tạo từ hình ảnh sang video:
      • Không được phép; máy chủ sẽ từ chối yêu cầu nếu sử dụng tham số.
  • numberOfVideos: Video đầu ra được yêu cầu, 1 hoặc 2.
  • durationSeconds: Thời lượng của mỗi video đầu ra tính bằng giây, từ 5 đến 8.
  • enhance_prompt: Bật hoặc tắt trình ghi lại lời nhắc. Bật theo mặc định.

Thông số kỹ thuật

Thủ đoạn
  • Tạo video từ văn bản
  • Tạo hình ảnh thành video
Độ trễ của yêu cầu
  • Tối thiểu: 11 giây
  • Tối đa: 6 phút (trong giờ cao điểm)
Tạo độ dài biến 5–8 giây
Giải pháp 720p
Tốc độ khung hình 24fps
Tỷ lệ khung hình
  • 16:9 – ngang
  • 9:16 - dọc
Ngôn ngữ đầu vào (văn bản sang video) Tiếng Anh

Video do Veo tạo được gắn hình mờ bằng SynthID, công cụ tạo hình mờ và xác định nội dung do AI tạo. Video cũng được lọc qua các bộ lọc an toàn và quy trình kiểm tra việc ghi nhớ để giảm thiểu rủi ro về quyền riêng tư, bản quyền và thiên kiến.

Những việc nên thử

Để khai thác tối đa Veo, hãy kết hợp thuật ngữ dành riêng cho video vào câu lệnh của bạn. Veo hiểu rõ nhiều thuật ngữ liên quan đến:

  • Bố cục cảnh quay: Chỉ định khung hình và số lượng đối tượng trong ảnh chụp (ví dụ: "quay một lần", "2 phát", "quay ngang").
  • Vị trí và chuyển động của máy ảnh: Kiểm soát vị trí và chuyển động của máy ảnh bằng các cụm từ như "mức mắt", "góc cao", "mắt sâu", "quay chụp nhanh", "chụp cận cảnh", "chụp lia máy" và "quay chụp".
  • Hiệu ứng lấy nét và ống kính: Hãy dùng các thuật ngữ như "lấy nét nông", "lấy nét sâu", "lấy nét mềm", "ống kính macro" và "ống kính góc rộng" để đạt được các hiệu ứng hình ảnh cụ thể.
  • Tổng thể về phong cách và chủ đề: Hướng dẫn định hướng sáng tạo của Veo bằng cách chỉ định các phong cách như "khoa học viễn tưởng", "phim hài lãng mạn", "phim hành động" hoặc "ảnh động". Bạn cũng có thể mô tả các chủ thể và cảnh nền mà mình muốn, chẳng hạn như "cảnh quan thành phố", "thiên nhiên", "phương tiện di chuyển" hoặc "động vật".

Hướng dẫn về câu lệnh Veo

Phần này của hướng dẫn Veo cung cấp các ví dụ về video mà bạn có thể tạo bằng Trình quản lý thẻ của Google (Veo) và cho biết cách sửa đổi câu lệnh để tạo ra các kết quả riêng biệt.

Bộ lọc an toàn

Veo áp dụng các bộ lọc an toàn trên Gemini để giúp đảm bảo rằng các video được tạo và ảnh tải lên không chứa nội dung phản cảm. Những câu lệnh vi phạm điều khoản và nguyên tắc của chúng tôi sẽ bị chặn.

Kiến thức cơ bản về cách viết câu lệnh

Câu lệnh hay cần mô tả cụ thể và rõ ràng. Để video được tạo gần với ý tưởng của bạn nhất có thể, hãy bắt đầu bằng cách xác định ý tưởng cốt lõi, sau đó tinh chỉnh ý tưởng bằng cách thêm từ khoá và công cụ sửa đổi.

Câu lệnh của bạn cần có các thành phần sau:

  • Tiêu đề: Vật thể, người, động vật hoặc phong cảnh mà bạn muốn đưa vào video.
  • Ngữ cảnh: Bối cảnh hoặc bối cảnh mà chủ thể được đặt.
  • Hành động: Những gì đối tượng đang làm (ví dụ: đi bộ, chạy hoặc quay đầu).
  • Kiểu: Kiểu này có thể chung chung hoặc rất cụ thể. Hãy cân nhắc sử dụng các từ khoá theo kiểu phim cụ thể, chẳng hạn như phim kinh dị, phim kinh dị hoặc kiểu hoạt hình như kiểu hoạt hình.
  • Chuyển động máy quay: [Không bắt buộc] Những hoạt động mà máy ảnh đang thực hiện, chẳng hạn như chế độ xem trên không, cấp độ mắt, chụp ảnh từ trên xuống hoặc chụp góc thấp.
  • Bố cục: [Không bắt buộc] Cách bố trí khung hình cho cảnh quay, chẳng hạn như chụp rộng, cận cảnh hoặc cận cảnh cực kỳ cận cảnh.
  • Ambiance: [Không bắt buộc] Cách màu sắc và ánh sáng đóng góp vào cảnh, chẳng hạn như tông màu xanh dương, ban đêm hoặc tông màu ấm.

Các mẹo khác để viết câu lệnh

Các mẹo sau đây giúp bạn viết câu lệnh tạo video:

  • Sử dụng ngôn ngữ mô tả: Sử dụng tính từ và trạng từ để vẽ nên một bức tranh rõ ràng cho Veo.
  • Cung cấp ngữ cảnh: Nếu cần, hãy cung cấp thông tin cơ bản để giúp mô hình hiểu bạn muốn gì.
  • Tham khảo các phong cách nghệ thuật cụ thể: Nếu bạn có ý tưởng về thẩm mỹ cụ thể, hãy tham khảo các phong cách nghệ thuật hoặc phong trào nghệ thuật cụ thể.
  • Sử dụng các công cụ kỹ thuật câu lệnh: Hãy cân nhắc việc khám phá các công cụ hoặc tài nguyên kỹ thuật soạn câu lệnh giúp bạn tinh chỉnh câu lệnh và đạt được kết quả tối ưu. Để biết thêm thông tin, hãy xem phần Giới thiệu về thiết kế lời nhắc.
  • Cải thiện các chi tiết khuôn mặt trong ảnh cá nhân và ảnh nhóm: Chỉ định chi tiết khuôn mặt làm tiêu điểm của ảnh, chẳng hạn như sử dụng từ dọc trong câu lệnh.

Câu lệnh và kết quả mẫu

Phần này trình bày một số câu lệnh, trong đó nêu bật cách các chi tiết mô tả có thể giúp nâng cao kết quả của mỗi video.

Sôi động

Video này minh hoạ cách sử dụng các thành phần trong nội dung cơ bản về soạn câu lệnh trong câu lệnh.

Câu lệnh Nội dung tạo sinh
Ảnh cận cảnh (thành phần) các cột đá tan chảy (chủ thể) trên một bức tường đá đóng băng (bối cảnh) với tông màu xanh dương lạnh (không gian), phóng to (chuyển động camera) duy trì chi tiết cận cảnh các vệt nước (hành động). Mưa đá nhỏ giọt trên nền màu xanh dương.

Một người đàn ông đang dùng điện thoại

Những video này minh hoạ cách bạn có thể sửa đổi câu lệnh bằng thông tin chi tiết ngày càng cụ thể để Veo tinh chỉnh kết quả theo ý thích của bạn.

Câu lệnh Nội dung tạo sinh Phân tích
Máy quay di chuyển để cho thấy cận cảnh một người đàn ông tuyệt vọng trong chiếc áo khoác màu xanh lục. Anh đang gọi điện trên một chiếc điện thoại gắn tường kiểu xoay có đèn neon màu xanh lục. Hình ảnh này trông giống như một cảnh trong phim. Người đàn ông đang nói chuyện trên điện thoại. Đây là video được tạo đầu tiên dựa trên câu lệnh.
Một cảnh quay cận cảnh điện ảnh theo dõi một người đàn ông tuyệt vọng mặc áo khoác dài màu xanh lục sẫm màu khi người này quay chiếc điện thoại xoay được đặt trên bức tường gạch thô ráp, ngập tràn ánh sáng kỳ lạ của bảng hiệu neon màu xanh lục. Máy quay di chuyển vào, cho thấy sự căng thẳng trong quai hàm và sự tuyệt vọng khắc sâu trên khuôn mặt của anh khi anh cố gắng thực hiện cuộc gọi. Độ sâu trường nông tập trung vào lông mày nhăn và chiếc điện thoại quay màu đen, làm mờ nền thành một biển màu neon và bóng mờ không rõ ràng, tạo cảm giác cấp bách và cô lập. Người đàn ông đang nói chuyện trên điện thoại Câu lệnh chi tiết hơn sẽ giúp video có nội dung tập trung hơn và có môi trường phong phú hơn.
Một video có chuyển động mượt mà, quay cận cảnh một người đàn ông tuyệt vọng trong chiếc áo khoác dài màu xanh lục, đang dùng một chiếc điện thoại quay số cổ điển dựa vào một bức tường được chiếu sáng bằng ánh sáng neon màu xanh lục ma quái. Máy ảnh bắt đầu từ một khoảng cách trung bình, từ từ di chuyển đến gần khuôn mặt của người đàn ông hơn, để lộ biểu cảm hoảng loạn và mồ hôi trên trán anh khi anh khẩn cấp quay số điện thoại. Điểm lấy nét là bàn tay của người đàn ông, các ngón tay của anh ta vụng về xoay núm vặn khi anh ta cố gắng kết nối. Ánh sáng neon xanh lục chiếu những bóng dài trên tường, làm tăng thêm bầu không khí căng thẳng. Cảnh này được sắp xếp để nhấn mạnh sự cô lập và tuyệt vọng của người đàn ông, làm nổi bật sự tương phản rõ rệt giữa ánh sáng neon rực rỡ và sự quyết tâm nghiêm khắc của người đàn ông. Người đàn ông đang nói chuyện trên điện thoại. Việc thêm nhiều chi tiết hơn mang lại cho chủ thể một biểu hiện chân thực và tạo ra một cảnh mãnh liệt và rực rỡ.

Báo tuyết

Ví dụ này minh hoạ kết quả mà Veo có thể tạo cho một câu lệnh đơn giản.

Câu lệnh Nội dung tạo sinh
Một sinh vật đáng yêu có bộ lông giống như báo tuyết đang đi bộ trong khu rừng vào mùa đông, kết xuất theo phong cách hoạt hình 3D. Báo tuyết đang hôn mê.

Báo tuyết đang chạy

Lời nhắc này có nhiều thông tin chi tiết hơn và minh hoạ kết quả được tạo có thể gần với nội dung bạn muốn đưa vào video của mình hơn.

Câu lệnh Nội dung tạo sinh
Tạo một cảnh hoạt hình 3D ngắn theo phong cách hoạt hình vui tươi. Một sinh vật dễ thương có bộ lông giống như hổ tuyết, đôi mắt to biểu cảm và hình dáng tròn trịa, thân thiện đang vui vẻ nhảy nhót qua một khu rừng mùa đông kỳ lạ. Cảnh này phải có những cây tròn phủ đầy tuyết, những bông tuyết rơi nhẹ nhàng và ánh nắng ấm áp xuyên qua các cành cây. Cử chỉ nhún nhảy và nụ cười rạng rỡ của sinh vật này phải thể hiện niềm vui thuần khiết. Hãy hướng đến tông màu vui vẻ, ấm áp với màu sắc tươi sáng, vui nhộn và ảnh động vui tươi. Snow Leopard chạy nhanh hơn.

Ví dụ bằng cách viết các phần tử

Những ví dụ này cho bạn biết cách tinh chỉnh câu lệnh của mình theo từng thành phần cơ bản.

Tiêu đề

Ví dụ này minh hoạ cách chỉ định nội dung mô tả tiêu đề.

Nội dung mô tả chủ đề Câu lệnh Nội dung tạo sinh
Nội dung mô tả có thể bao gồm một chủ đề hoặc nhiều chủ thể và hành động. Ở đây, chủ đề của chúng ta là "toà nhà chung cư bằng bê tông màu trắng". Hình ảnh kết xuất kiến trúc của một toà nhà căn hộ bằng bê tông màu trắng với các hình dạng hữu cơ uyển chuyển, kết hợp liền mạch với cây xanh tươi tốt và các yếu tố mang hơi hướng tương lai Phần giữ chỗ.

Ngữ cảnh

Ví dụ này cho bạn biết cách chỉ định ngữ cảnh.

Bối cảnh Câu lệnh Nội dung tạo sinh
Bối cảnh hoặc nền mà chủ thể sẽ được đặt là rất quan trọng. Hãy thử đặt đối tượng của bạn trong nhiều bối cảnh như trên một con đường đông đúc hoặc trong không gian vũ trụ. Một vệ tinh trôi trong không gian vũ trụ với mặt trăng và một vài ngôi sao ở phía sau. Vệ tinh trôi nổi trong bầu khí quyển.

Hành động

Ví dụ này cho bạn biết cách chỉ định hành động.

Hành động Câu lệnh Nội dung tạo sinh
Chủ thể đang làm gì như đi bộ, chạy hoặc quay đầu. Ảnh chụp rộng về một người phụ nữ đang đi bộ dọc theo bãi biển, trông có vẻ hài lòng và thư giãn về phía đường chân trời lúc hoàng hôn. Cảnh hoàng hôn tuyệt đẹp.

Phong cách

Ví dụ này cho bạn biết cách chỉ định kiểu.

Kiểu Câu lệnh Nội dung tạo sinh
Bạn có thể thêm từ khoá để cải thiện chất lượng tạo nội dung và điều chỉnh hướng đó sao cho phù hợp hơn với phong cách dự định, chẳng hạn như độ sâu trường ảnh nông, ảnh tĩnh trong phim, tối thiểu, siêu thực, cổ điển, tương lai hoặc phơi sáng kép. Theo phong cách phim đen, người đàn ông và người phụ nữ đi bộ trên đường phố, bí ẩn, điện ảnh, đen trắng. Phong cách phim đen thật là đẹp.

Chuyển động của máy ảnh

Ví dụ này cho bạn biết cách chỉ định chuyển động của camera.

Chuyển động của máy ảnh Câu lệnh Nội dung tạo sinh
Các lựa chọn về chuyển động của máy quay bao gồm cảnh quay từ góc nhìn người thứ nhất, cảnh quay trên không, cảnh quay theo dõi bằng máy bay không người lái hoặc cảnh quay theo dõi. Ảnh từ góc nhìn của nhân vật (POV) từ một chiếc ô tô cổ điển lái xe dưới mưa ở Canada vào ban đêm, theo hiệu ứng điện ảnh. Cảnh hoàng hôn tuyệt đẹp.

Bản sáng tác

Ví dụ này cho bạn biết cách chỉ định thành phần.

Thành phần Câu lệnh Nội dung tạo sinh
Cách bố trí khung hình cảnh quay (quay rộng, cận cảnh, góc thấp). Cận cảnh một con mắt với hình ảnh thành phố phản chiếu trong đó. Cảnh hoàng hôn tuyệt đẹp.
Tạo video có cảnh rộng lớn về người lướt sóng đi bộ trên bãi biển với ván lướt sóng, cảnh hoàng hôn tuyệt đẹp, đậm chất điện ảnh. Cảnh hoàng hôn tuyệt đẹp.

Môi trường

Ví dụ này cho bạn biết cách chỉ định môi trường xung quanh.

Ambiance Câu lệnh Nội dung tạo sinh
Bảng màu đóng vai trò quan trọng trong nhiếp ảnh, ảnh hưởng đến tâm trạng và truyền tải cảm xúc dự định. Hãy thử những câu lệnh như "tông màu ấm màu cam nhạt", "ánh sáng tự nhiên", "mặt trời mọc" hoặc "hoàng hôn". Ví dụ: bảng màu vàng, ấm áp có thể mang đến cảm giác lãng mạn và bầu không khí vào bức ảnh. Ảnh cận cảnh một cô gái đang ôm chú chó golden retriever đáng yêu trong công viên, dưới ánh nắng. Một chú cún con trong vòng tay của một cô bé.
Cảnh quay cận cảnh đậm chất điện ảnh về một người phụ nữ buồn bã đi xe buýt trong mưa, tông màu xanh dương lạnh, tâm trạng buồn bã. Một người phụ nữ ngồi trên xe buýt với vẻ mặt buồn bã.

Sử dụng hình ảnh tham khảo để tạo video

Bạn có thể làm sống động hình ảnh bằng cách sử dụng tính năng chuyển hình ảnh sang video của Veo. Bạn có thể sử dụng các thành phần hiện có hoặc thử Imagen để tạo nội dung mới.

Câu lệnh Nội dung tạo sinh
Thỏ có thanh kẹo sô cô la. Thỏ đang chạy đi.
Thỏ chạy trốn. Thỏ đang chạy đi.

Câu lệnh phủ định

Câu lệnh phủ định có thể là một công cụ hữu ích giúp chỉ định những yếu tố mà bạn không muốn có trong video. Mô tả nội dung bạn không muốn mô hình tạo ra sau cụm từ "Câu lệnh phủ định". Hãy làm theo các mẹo sau:

  • ❌ Không dùng ngôn từ mang tính hướng dẫn học hoặc các từ như không hoặc không nên. Ví dụ: "Không có tường" hoặc "không hiển thị tường".

  • ✅ Mô tả những nội dung bạn không muốn thấy. Ví dụ: "wall, frame" có nghĩa là bạn không muốn có tường hoặc khung trong video.

Câu lệnh Nội dung tạo sinh
Tạo ảnh động ngắn cách điệu về một cây sồi lớn, đơn độc với những chiếc lá thổi mạnh mẽ trong một cơn gió mạnh. Cây phải có hình dạng hơi phóng đại, kỳ lạ với các nhánh động và thẳng. Những chiếc lá sẽ có nhiều màu sắc mùa thu, xoay mình và nhảy múa trong gió. Ảnh động phải sử dụng bảng màu ấm và hấp dẫn. Cây có sử dụng từ.
Tạo ảnh động ngắn cách điệu về một cây sồi lớn, đơn độc với những chiếc lá thổi mạnh mẽ trong một cơn gió mạnh. Cây phải có hình dạng hơi phóng đại, kỳ lạ với các nhánh động và thẳng. Những chiếc lá sẽ có nhiều màu sắc mùa thu, xoay mình và nhảy múa trong gió. Ảnh động phải sử dụng bảng màu ấm và hấp dẫn.

Có câu lệnh tiêu cực – phông nền đô thị, cấu trúc nhân tạo, bầu không khí tối, giông bão hoặc đe doạ.
Cây không có từ phủ định.

Tỷ lệ khung hình

Tính năng tạo video của Gemini Veo hỗ trợ 2 tỷ lệ khung hình sau đây:

Tỷ lệ khung hình Nội dung mô tả
Màn hình rộng hoặc 16:9 Tỷ lệ khung hình phổ biến nhất cho TV, màn hình và màn hình điện thoại di động (ngang). Sử dụng chế độ này khi bạn muốn chụp nhiều cảnh nền hơn, chẳng hạn như trong cảnh quan thiên nhiên.
Dọc hoặc 9:16 Đã xoay màn hình rộng. Tỷ lệ khung hình này đã trở nên phổ biến trên các ứng dụng video ngắn, chẳng hạn như video ngắn trên YouTube. Dùng kiểu này cho ảnh chân dung hoặc vật thể cao có hướng dọc rõ ràng, chẳng hạn như toà nhà, cây cối, thác nước hoặc toà nhà.

Màn hình rộng

Câu lệnh này là một ví dụ về tỷ lệ khung hình 16:9 trên màn hình rộng.

Câu lệnh Nội dung tạo sinh
Tạo video có góc nhìn theo dõi từ trên cao của một chiếc máy bay không người lái về một người đàn ông lái chiếc xe mui trần màu đỏ ở Palm Springs, những năm 1970, ánh nắng ấm áp, bóng dài. Thác nước tuyệt đẹp.

Dọc

Câu lệnh này là ví dụ về tỷ lệ khung hình dọc 9:16.

Câu lệnh Nội dung tạo sinh
Tạo video nêu bật chuyển động mượt mà của thác nước Hawaii hùng vĩ trong khu rừng nhiệt đới xanh tươi. Tập trung vào dòng nước chân thực, tán lá chi tiết và ánh sáng tự nhiên để mang lại sự yên bình. Chụp lại dòng nước chảy xiết, không khí mờ ảo và ánh nắng lấp lánh xuyên qua tán cây rậm rạp. Sử dụng các chuyển động mượt mà, có hiệu ứng điện ảnh để chụp thác nước và khung cảnh xung quanh. Hướng đến một tông điệu êm ái, chân thực, đưa người xem đến với vẻ đẹp thanh bình của rừng rừng Hawaii. Thác nước tuyệt đẹp.

Bước tiếp theo