Video mit Veo generieren

Die Gemini API bietet Zugriff auf Veo 2, das leistungsstärkste Modell zur Videogenerierung von Google. Veo generiert Videos in einer Vielzahl von filmischen und visuellen Stilen und erfasst Nuancen, um komplexe Details in allen Frames konsistent zu rendern. Dieser Leitfaden hilft dir beim Einstieg in Veo mit der Gemini API.

Eine Anleitung für Videoprompts findest du im Abschnitt Veo-Prompt-Leitfaden.

Hinweis

Bevor Sie die Gemini API aufrufen, müssen Sie das von Ihnen ausgewählte SDK installiert und einen Gemini API-Schlüssel konfiguriert und einsatzbereit haben.

Wenn du Veo mit den Google Gen AI SDKs verwenden möchtest, musst du eine der folgenden Versionen installiert haben:

Videos generieren

Dieser Abschnitt enthält Codebeispiele zum Generieren von Videos mithilfe von Text-Prompts und Bildern.

Aus Text generieren

Mit dem folgenden Code kannst du Videos mit Veo erstellen:

import time
from google import genai
from google.genai import types

client = genai.Client()  # read API key from GOOGLE_API_KEY

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="dont_allow",  # "dont_allow" or "allow_adult"
        aspect_ratio="16:9",  # "16:9" or "9:16"
    ),
)

while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)

for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # save the video

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    config: {
      personGeneration: "dont_allow",
      aspectRatio: "16:9",
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(`${generatedVideo.video?.uri}&key=GOOGLE_API_KEY`); // append your API key
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();
package main

import (
  "context"
  "fmt"
  "os"
  "time"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:      "16:9",
      PersonGeneration: "dont_allow",
  }

  operation, _ := client.Models.GenerateVideos(
      ctx,
      "veo-2.0-generate-001",
      "Panning wide shot of a calico kitten sleeping in the sunshine",
      nil,
      videoConfig,
  )

  for !operation.Done {
      time.Sleep(20 * time.Second)
      operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
  }

  for n, video := range operation.Response.GeneratedVideos {
      client.Files.Download(ctx, video.Video, nil)
      fname := fmt.Sprintf("video_%d.mp4", n)
      _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
  }
}
# Use curl to send a POST request to the predictLongRunning endpoint.
# The request body includes the prompt for video generation.
curl "${BASE_URL}/models/veo-2.0-generate-001:predictLongRunning?key=${GOOGLE_API_KEY}" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "Panning wide shot of a calico kitten sleeping in the sunshine"
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "personGeneration": "dont_allow",
    }
  }' | tee result.json | jq .name | sed 's/"//g' > op_name

# Obtain operation name to download video.
op_name=$(cat op_name)

# Check against status of operation.
while true; do
  is_done=$(curl "${BASE_URL}/${op_name}?key=${GOOGLE_API_KEY}" | tee op_check.json | jq .done)

  if [ "${is_done}" = "true" ]; then
    cat op_check.json
    echo "** Attach API_KEY to download video, or examine error message."
    break
  fi

  echo "** Video ${op_name} has not downloaded yet!  Check again after 5 seconds..."

  # Wait for 5 seoncds to check again.
  sleep 5

done

Ein Kätzchen, das in der Sonne schläft.

Die Ausführung dieses Codes dauert etwa 2–3 Minuten. Wenn Ressourcen beschränkt sind, kann es jedoch auch länger dauern. Nach Abschluss der Ausführung sollte ein Video angezeigt werden, das in etwa so aussieht:

Wenn anstelle eines Videos eine Fehlermeldung angezeigt wird, sind die Ressourcen eingeschränkt und Ihre Anfrage konnte nicht abgeschlossen werden. Führen Sie in diesem Fall den Code noch einmal aus.

Generierte Videos werden zwei Tage lang auf dem Server gespeichert. Danach werden sie entfernt. Wenn Sie eine lokale Kopie des generierten Videos speichern möchten, müssen Sie result() und save() innerhalb von zwei Tagen nach der Generierung ausführen.

Aus Bildern generieren

Sie können auch anhand von Bildern Videos generieren. Der folgende Code generiert ein Bild mit Imagen und verwendet das generierte Bild dann als Start-Frame für das generierte Video.

Generieren Sie zuerst mit Imagen ein Bild:

prompt="Panning wide shot of a calico kitten sleeping in the sunshine",

imagen = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(
      aspect_ratio="16:9",
      number_of_images=1
    )
)

imagen.generated_images[0].image
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });
const response = await ai.models.generateImages({
  model: "imagen-3.0-generate-002",
  prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
  config: {
    numberOfImages: 1,
  },
});

// you'll pass response.generatedImages[0].image.imageBytes to Veo
package main

import (
    "context"
    "fmt"
    "os"
    "time"
    "google.golang.org/genai"
)

func main() {

    ctx := context.Background()
    client, _ := genai.NewClient(ctx, &genai.ClientConfig{
        APIKey:  os.Getenv("GEMINI_API_KEY"),
        Backend: genai.BackendGeminiAPI,
    })

    config := &genai.GenerateImagesConfig{
        AspectRatio:    "16:9",
        NumberOfImages: 1,
    }

    response, _ := client.Models.GenerateImages(
        ctx,
        "imagen-3.0-generate-002",
        "Panning wide shot of a calico kitten sleeping in the sunshine",
        config,
    )

    // you'll pass response.GeneratedImages[0].Image to Veo
}

Generieren Sie dann ein Video mit dem resultierenden Bild als ersten Frame:

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt=prompt,
    image = imagen.generated_images[0].image,
    config=types.GenerateVideosConfig(
      # person_generation is not allowed for image-to-video generation
      aspect_ratio="16:9",  # "16:9" or "9:16"
      number_of_videos=2
    ),
)

# Wait for videos to generate
 while not operation.done:
  time.sleep(20)
  operation = client.operations.get(operation)

for n, video in enumerate(operation.response.generated_videos):
    fname = f'with_image_input{n}.mp4'
    print(fname)
    client.files.download(file=video.video)
    video.video.save(fname)
import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({ apiKey: "GOOGLE_API_KEY" });

async function main() {
  // get image bytes from Imagen, as shown above

  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    image: {
      imageBytes: response.generatedImages[0].image.imageBytes, // response from Imagen
      mimeType: "image/png",
    },
    config: {
      aspectRatio: "16:9",
      numberOfVideos: 2,
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(
      `${generatedVideo.video?.uri}&key=GOOGLE_API_KEY`, // append your API key
    );
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();
    image := response.GeneratedImages[0].Image

    videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:    "16:9",
      NumberOfVideos: 2,
    }

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-2.0-generate-001",
        "A dramatic scene based on the input image",
        image,
        videoConfig,
    )

    for !operation.Done {
        time.Sleep(20 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    for n, video := range operation.Response.GeneratedVideos {
        client.Files.Download(ctx, video.Video, nil)
        fname := fmt.Sprintf("video_with_image_input_%d.mp4", n)
        _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    }
}

Veo-Modellparameter

Die Namenskonventionen variieren je nach Programmiersprache.

  • prompt: Der Text-Prompt für das Video. Der Parameter image ist optional.
  • image: Das Bild, das als erster Frame für das Video verwendet werden soll. Der Parameter prompt ist optional.
  • negativePrompt: Textstring, der alles beschreibt, was das Modell nicht generieren soll
  • aspectRatio: Ändert das Seitenverhältnis des generierten Videos. Unterstützte Werte sind "16:9" und "9:16". Der Standardwert ist "16:9".
  • personGeneration: Das Modell kann Videos von Personen generieren. Folgende Werte werden unterstützt:
    • Text-zu-Video-Generierung:
      • "dont_allow": Es sind keine Personen oder Gesichter zu sehen.
      • "allow_adult": Videos mit Erwachsenen, aber ohne Kinder generieren.
    • Bild-zu-Video-Generierung:
      • Nicht zulässig; bei Verwendung des Parameters lehnt der Server die Anfrage ab.
  • numberOfVideos: Angeforderte Ausgabevideos, entweder 1 oder 2.
  • durationSeconds: Länge jedes Ausgabevideos in Sekunden, zwischen 5 und 8.
  • enhance_prompt: Prompt-Umschreiber aktivieren oder deaktivieren Standardmäßig aktiviert.

Spezifikationen

Modalitäten
  • Text-zu-Video-Generierung
  • Bild-zu-Video-Generierung
Anfragelatenz
  • Mindestens 11 Sekunden
  • Maximal: 6 Minuten (in Spitzenzeiten)
Generierung variabler Länge 5–8 Sekunden
Lösung 720p
Framerate 24 fps
Seitenverhältnis
  • 16:9 – Querformat
  • 9:16 – Hochformat
Eingabesprachen (Text-zu-Video) Englisch

Von Veo erstellte Videos werden mit SynthID, unserem Tool zum Kennzeichnen und Identifizieren von KI-generierten Inhalten, mit einem Wasserzeichen versehen. Außerdem werden sie Sicherheitsfiltern und Memorisierungsüberprüfungen unterzogen, um Datenschutz-, Urheberrechts- und Voreingenommenheitsrisiken zu minimieren.

Lösungsvorschlag

Integrieren Sie videospezifische Terminologie in Ihre Prompts, um Veo optimal zu nutzen. Veo versteht eine Vielzahl von Begriffen im Zusammenhang mit:

  • Bildkomposition:Geben Sie den Bildausschnitt und die Anzahl der Motive an (z.B. „Einzelaufnahme“, „zwei Aufnahme“, „über die Schulter fotografieren“).
  • Kameraposition und -bewegung:Steuern Sie Position und Bewegung der Kamera mithilfe von Begriffen wie „Augenhöhe“, „Hoher Winkel“, „Würmerauge“, „Dolly Shot“, „Zoomshot“, „Schwenkaufnahme“ und „Nachverfolgungsaufnahme“.
  • Fokus- und Objektiveffekte:Verwenden Sie Begriffe wie „Flachfokus“, „Tiefenfokus“, „Weichzeichner“, „Makroobjektiv“ und „Weitwinkelobjektiv“, um bestimmte visuelle Effekte zu erzielen.
  • Allgemeiner Stil und Thema:Legen Sie die kreative Richtung von Veo fest, indem Sie Stile wie „Science-Fiction“, „Romantische Komödie“, „Actionfilm“ oder „Animation“ angeben. Sie können auch die gewünschten Motive und Hintergründe beschreiben, z. B. „Stadtlandschaft“, „Natur“, „Fahrzeuge“ oder „Tiere“.

Veo-Prompt-Anleitung

Dieser Abschnitt des Veo-Leitfadens enthält Beispiele für Videos, die Sie mit Veo erstellen können. Außerdem erfahren Sie, wie Sie Prompts ändern können, um unterschiedliche Ergebnisse zu erzielen.

Sicherheitsfilter

Veo wendet Sicherheitsfilter in Gemini an, damit generierte Videos und hochgeladene Fotos keine anstößigen Inhalte enthalten. Prompts, die gegen unsere Nutzungsbedingungen und Richtlinien verstoßen, werden blockiert.

Grundlagen zum Schreiben von Prompts

Gute Prompts sind beschreibend und klar. Damit das generierte Video so nah wie möglich an Ihren Vorstellungen liegt, sollten Sie zuerst Ihre Hauptidee definieren und sie dann durch Keywords und Modifikatoren verfeinern.

Der Prompt sollte die folgenden Elemente enthalten:

  • Motiv: Das Objekt, die Person, das Tier oder die Landschaft, die Sie in Ihrem Video haben möchten.
  • Kontext: Der Hintergrund oder Kontext, in dem sich das Motiv befindet.
  • Aktion: Was die Testperson gerade macht (z. B. gehen, laufen oder den Kopf drehen).
  • Stil: Dieser kann allgemein oder sehr spezifisch sein. Verwenden Sie spezifische Keywords für den Filmstil, etwa Horrorfilm, film noir oder animierte Stile wie Zeichentrickstil.
  • Kamerabewegung: [optional] Die von der Kamera ausgeführten Aktionen, z. B. Luftaufnahme, auf Augenhöhe, Draufsicht oder Aufnahme mit niedrigem Winkel.
  • Komposition: [optional] Die Art der Aufnahme, z. B. Weitwinkelaufnahme, Nahaufnahme oder Extreme Nahaufnahme.
  • Ambiance: [Optional] Gibt an, wie Farbe und Licht zur Szene beitragen, z. B. Blautöne, Nacht oder warme Töne.

Weitere Tipps zum Verfassen von Prompts

Die folgenden Tipps helfen dir dabei, Prompts zu schreiben, die deine Videos generieren:

  • Verwenden Sie eine beschreibende Sprache: Verwenden Sie Adjektive und Adverbien, um Veo ein klares Bild zu vermitteln.
  • Kontext bereitstellen: Geben Sie bei Bedarf Hintergrundinformationen an, damit das Modell versteht, was Sie möchten.
  • Beziehen Sie sich auf bestimmte künstlerische Stile: Wenn Sie eine bestimmte Ästhetik im Sinn haben, beziehen Sie sich auf bestimmte künstlerische Stile oder Kunstbewegungen.
  • Tools für Prompt Engineering verwenden: Es gibt Tools oder Ressourcen für Prompt Engineering, mit denen Sie Ihre Prompts optimieren und optimale Ergebnisse erzielen können. Weitere Informationen finden Sie unter Einführung in das Prompt-Design.
  • Gesichtsdetails in Ihren persönlichen und Gruppenbildern hervorheben: Legen Sie Gesichtsdetails als Schwerpunkt des Fotos fest, indem Sie beispielsweise das Wort Porträt in den Prompt einfügen.

Beispiel-Prompts und -Ausgaben

In diesem Abschnitt werden mehrere Prompts präsentiert, die zeigen, wie beschreibende Details das Ergebnis der einzelnen Videos verbessern können.

Eiszapfen

In diesem Video wird gezeigt, wie Sie die Elemente der Grundlagen für das Schreiben von Prompts in Ihrem Prompt verwenden können.

Eingabeaufforderung Generierte Ausgabe
Nahaufnahme (Zusammensetzung) schmelzender Eiszapfen (Motiv) an einer gefrorenen Felswand (Kontext) mit kühlen Blautönen (Ambiente) und Nahaufnahme (Kamerabewegung) unter Beibehaltung der Nahaufnahme von Wassertropfen (Aktion). Tropfende Eiszapfen vor blauem Hintergrund.

Mann am Telefon

In diesen Videos wird gezeigt, wie Sie Ihren Prompt mit immer spezifischeren Details überarbeiten können, damit Veo die Ausgabe nach Ihren Wünschen optimieren kann.

Eingabeaufforderung Generierte Ausgabe Analyse
Die Kamera fährt heran, um einen verzweifelten Mann in einem grünen Trenchcoat in Nahaufnahme zu zeigen. Er telefoniert mit einem Wählscheibentelefon mit grüner Neonbeleuchtung. Es sieht aus wie eine Filmszene. Mann, der telefoniert. Das ist das erste generierte Video auf Grundlage des Prompts.
In einer Nahaufnahme wird ein verzweifelter Mann in einem abgenutzten grünen Trenchcoat gezeigt, der eine Wählscheibe eines Telefons dreht, das an einer rauen Backsteinmauer angebracht ist und im unheimlichen Licht einer grünen Neonreklame steht. Die Kamera zoomt heran und zeigt die Anspannung in seinem Kiefer und die Verzweiflung in seinem Gesicht, während er versucht, den Anruf zu starten. Die geringe Schärfentiefe konzentriert sich auf seine gefurchten Stirn und das schwarze Telefon mit Wählscheibe. Der Hintergrund verschwimmt in einem Meer aus Neonfarben und uneindeutigen Schatten, wodurch ein Gefühl von Dringlichkeit und Isolation entsteht. Mann, der telefoniert Ein detaillierterer Prompt führt zu einem Video, das fokussierter ist und eine reichhaltigere Umgebung hat.
Ein Video mit flüssigen Bewegungen, bei dem ein verzweifelter Mann in einem grünen Trenchcoat, der an einer Wand steht, die in einem unheimlichen grünen Neonlicht gebadet ist, ein altes Wähltelefon verwendet. Die Kamera beginnt in mittlerer Entfernung und bewegt sich langsam auf das Gesicht des Mannes zu. Dabei ist sein hektischer Gesichtsausdruck und der Schweiß auf seiner Stirn zu sehen, während er in aller Eile eine Telefonnummer wählt. Der Fokus liegt auf den Händen des Mannes. Seine Finger klopfen am Regler herum, während er verzweifelt versucht, eine Verbindung herzustellen. Das grüne Neonlicht wirft lange Schatten an die Wand, was die angespannte Atmosphäre noch verstärkt. Die Szene ist so komponiert, dass die Isolation und Verzweiflung des Mannes betont werden. Der starke Kontrast zwischen dem leuchtenden Neonlicht und der grimmigen Entschlossenheit des Mannes wird hervorgehoben. Mann, der telefoniert. Durch zusätzliche Details erhält das Motiv einen realistischen Ausdruck und sorgt für eine intensive und lebendige Szene.

Schneeleopard

Dieses Beispiel zeigt die Ausgabe, die Veo für einen einfachen Prompt generieren könnte.

Eingabeaufforderung Generierte Ausgabe
Ein niedliches Tier mit Schneeleopardenfell geht durch einen Winterwald. 3D-Cartoon-Render. Der Schneeleopard ist lethargisch.

Rennender Schneeleopard

Dieser Prompt enthält mehr Details und zeigt eine generierte Ausgabe, die möglicherweise besser zu dem passt, was du in deinem Video haben möchtest.

Eingabeaufforderung Generierte Ausgabe
Erstellen Sie eine kurze 3D-animierte Szene im fröhlichen Cartoonstil. Ein niedliches Wesen mit Schneeleopardenfell, großen ausdrucksstarken Augen und einer freundlichen, runden Form trabt fröhlich durch einen skurril gestalteten Winterwald. Die Szene sollte abgerundete, schneebedeckte Bäume, sanft fallende Schneeflocken und warmes Sonnenlicht zeigen, das durch die Äste scheint. Die federnden Bewegungen und das breite Lächeln des Wesens sollten pure Freude ausdrücken. Verwenden Sie helle, fröhliche Farben und verspielte Animationen, um einen positiven, herzerwärmenden Ton zu erzeugen. Schneeleopard läuft schneller.

Beispiele durch das Schreiben von Elementen

Diese Beispiele zeigen, wie du deine Prompts mit den einzelnen Grundelementen verfeinern kannst.

Betreff

In diesem Beispiel wird gezeigt, wie Sie eine Betreffbeschreibung angeben.

Beschreibung des Themas Eingabeaufforderung Generierte Ausgabe
Die Beschreibung kann ein Thema oder mehrere Themen und Aktionen umfassen. Hier ist unser Motiv „weißes Betonwohnhaus“. Eine architektonische Darstellung eines Wohngebäudes aus weißem Beton mit fließenden organischen Formen, die sich nahtlos in üppige Vegetation und futuristische Elemente einfügen Platzhalter.

Kontext

In diesem Beispiel wird gezeigt, wie Sie den Kontext angeben.

Kontext Eingabeaufforderung Generierte Ausgabe
Der Hintergrund oder Kontext, in dem das Motiv platziert wird, ist sehr wichtig. Platzieren Sie das Motiv vor verschiedenen Hintergründen, z. B. in einer belebten Straße oder im Weltraum. Ein Satellit, der durch das All schwebt, mit dem Mond und einigen Sternen im Hintergrund. Satellit, der in der Atmosphäre schwebt.

Aktion

In diesem Beispiel wird gezeigt, wie die Aktion angegeben wird.

Aktion Eingabeaufforderung Generierte Ausgabe
Was macht das Motiv, z. B. geht es, läuft es oder dreht es den Kopf? Weitwinkelaufnahme einer Frau, die am Strand spazieren geht und Inhalte sieht und sich in Richtung Horizont bei Sonnenuntergang blickt. Der Sonnenuntergang ist wunderschön.

Stil

In diesem Beispiel wird gezeigt, wie Sie den Stil angeben.

Design Eingabeaufforderung Generierte Ausgabe
Sie können Keywords hinzufügen, um die Generierungsqualität zu verbessern und dem gewünschten Stil zu folgen, z. B. geringe Schärfentiefe, Standbild des Films, Minimalistisch, surreal, Vintage, futuristisch oder Doppelbelichtung. Film Noir-Stil, Mann und Frau gehen die Straße entlang, Mystery, cinematisch, Schwarz-Weiß. Der Film Noir-Stil ist absolut schön.

Kamerabewegung

In diesem Beispiel wird gezeigt, wie eine Kamerabewegung angegeben wird.

Kamerabewegung Eingabeaufforderung Generierte Ausgabe
Zu den Optionen für die Kamerabewegung gehören POV-Aufnahmen, Luftaufnahmen, Drohnenaufnahmen und Tracking-Aufnahmen. Eine POV-Aufnahme aus einem Oldtimer, der bei Nacht durch Kanada fährt, im Regen, cinematisch Der Sonnenuntergang ist wunderschön.

Komposition

In diesem Beispiel wird gezeigt, wie Sie die Zusammensetzung angeben.

Zusammensetzung Eingabeaufforderung Generierte Ausgabe
Art des Bildausschnitts (Weitwinkel, Nahaufnahme, niedriger Blickwinkel) Extreme Nahaufnahme eines Auges, in dem sich die Stadt spiegelt. Der Sonnenuntergang ist wunderschön.
Erstelle ein Video mit einer Weitwinkelaufnahme eines Surfers, der mit einem Surfbrett am Strand entlangläuft, wunderschöner Sonnenuntergang, Filmlook. Der Sonnenuntergang ist wunderschön.

Ambiente

In diesem Beispiel wird gezeigt, wie Sie die Atmosphäre festlegen.

Ambiance Eingabeaufforderung Generierte Ausgabe
Farbpaletten spielen in der Fotografie eine wichtige Rolle, beeinflussen die Stimmung und vermitteln beabsichtigte Emotionen. Versuche es zum Beispiel mit „warmen Orangetönen“, „Natürliches Licht“, „Sonnenaufgang“ oder „Sonnenuntergang“. Eine warme, goldene Palette kann einem Foto beispielsweise ein romantisches und stimmungsvolles Ambiente verleihen. Nahaufnahme eines Mädchens, das einen süßen Golden Retriever-Welpen im Park hält, Sonnenlicht. Ein Welpe in den Armen eines jungen Mädchens.
Filmische Nahaufnahme einer traurigen Frau, die im Regen mit dem Bus fährt, kühle Blautöne, traurige Stimmung. Eine Frau, die in einem Bus sitzt und traurig ist.

Referenzbilder zum Generieren von Videos verwenden

Mit der Bild-zu-Video-Funktion von Veo können Sie Bilder zum Leben erwecken. Sie können vorhandene Assets verwenden oder Imagen ausprobieren, um etwas Neues zu generieren.

Eingabeaufforderung Generierte Ausgabe
Hase mit einer Schokoladentafel. Bunny läuft weg.
Hase läuft weg. Bunny läuft weg.

Negative Prompts

Negative Prompts können ein leistungsstarkes Tool sein, mit dem Sie angeben können, welche Elemente nicht im Video vorkommen sollen. Beschreiben Sie nach dem Begriff „Negativ-Prompt“, was das Modell nicht generieren soll. Befolge diese Tipps:

  • ❌ Verwenden Sie keine Formulierungen oder Wörter wie nein oder nicht. Beispiel: „Keine Wände anzeigen“ oder „Keine Wände anzeigen“.

  • ✅ Beschreiben Sie, was Sie nicht sehen möchten. Beispiel: „wand, rahmen“, was bedeutet, dass keine Wände oder Rahmen im Video zu sehen sein sollen.

Eingabeaufforderung Generierte Ausgabe
Erstellen Sie eine kurze, stilisierte Animation eines großen, einsamen Eichenbaums, dessen Blätter bei starkem Wind heftig hin und her wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben haben und im Wind wirbeln und tanzen. Die Animation sollte eine warme, einladende Farbpalette verwenden. Baum mit Wörtern, die verwendet werden.
Erstellen Sie eine kurze, stilisierte Animation eines großen, einsamen Eichenbaums, dessen Blätter bei starkem Wind heftig hin und her wehen. Der Baum sollte eine leicht übertriebene, skurrile Form mit dynamischen, fließenden Ästen haben. Die Blätter sollten eine Vielzahl von Herbstfarben haben und im Wind wirbeln und tanzen. Die Animation sollte eine warme, einladende Farbpalette verwenden.

Mit negativem Prompt – urbaner Hintergrund, von Menschen geschaffene Strukturen, dunkle, stürmische oder bedrohliche Atmosphäre.
Baum ohne negative Wörter.

Seitenverhältnisse

Die Videogenerierung von Gemini Veo unterstützt die folgenden beiden Seitenverhältnisse:

Seitenverhältnis Beschreibung
Breitbild oder 16:9 Das gängigste Seitenverhältnis für Fernseher, Monitore und Bildschirme von Smartphones (Querformat). Verwenden Sie dieses Seitenverhältnis, wenn Sie mehr vom Hintergrund erfassen möchten, z. B. bei malerischen Landschaften.
Hochformat oder 9:16 Breitbildformat gedreht. Dieses Seitenverhältnis ist bei Anwendungen für Kurzvideos wie YouTube Shorts bekannt. Verwenden Sie diese Option für Porträts oder große Objekte mit starker vertikaler Ausrichtung, z. B. Gebäude, Bäume, Wasserfall oder Gebäude.

Widescreen

Dieser Prompt ist ein Beispiel für das Breitbildseitenverhältnis von 16:9.

Eingabeaufforderung Generierte Ausgabe
Erstelle ein Video mit einer Nachverfolgungsdrohne von einem Mann, der in Palm Springs in den 1970ern ein rotes Cabrio fährt, warmes Sonnenlicht, lange Schatten. Der Wasserfall ist absolut wunderschön.

Hochformat

Dieser Prompt ist ein Beispiel für das Hochformat mit einem Seitenverhältnis von 9:16.

Eingabeaufforderung Generierte Ausgabe
Erstelle ein Video, in dem die sanfte Bewegung eines majestätischen Wasserfalls in einem üppigen Regenwald hervorgehoben wird. Konzentrieren Sie sich auf realistische Strömungen, detailliertes Laub und natürliches Licht, um Ruhe zu vermitteln. Fotografieren Sie das rauschende Wasser, die neblige Atmosphäre und das durch die dichten Baumkronen fließende Sonnenlicht. Verwende ruhige, filmische Kamerabewegungen, um den Wasserfall und seine Umgebung zu präsentieren. Zielen Sie auf einen ruhigen, realistischen Ton, der die Zuschauer in die ruhige Schönheit des hawaiianischen Regenwaldes entführt. Der Wasserfall ist absolut wunderschön.

Nächste Schritte

  • Mit dem Veo Colab kannst du mehr Erfahrung mit der Erstellung von KI-Videos sammeln.
  • Coole Beispiele für die Verwendung von Veo 2 auf der Google DeepMind-Website