Generowanie obrazów za pomocą Imagen

Imagen to model Google do generowania obrazów o wysokiej wierności, który potrafi tworzyć realistyczne obrazy wysokiej jakości na podstawie promptów tekstowych. Wszystkie wygenerowane obrazy zawierają znak wodny SynthID. Więcej informacji o dostępnych wariantach modelu Imagen znajdziesz w sekcji Wersje modelu.

Generowanie obrazów za pomocą modeli Imagen

Ten przykład pokazuje generowanie obrazów za pomocą modelu Imagen:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

Przeczytaj

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Obraz wygenerowany przez AI przedstawiający robota trzymającego czerwoną deskorolkę
Obraz wygenerowany przez AI przedstawiający robota trzymającego czerwoną deskorolkę

Konfiguracja Imagen

Obecnie Imagen obsługuje tylko prompty w języku angielskim i te parametry:

  • numberOfImages: liczba obrazów do wygenerowania, od 1 do 4 (włącznie). Wartość domyślna to 4.
  • sampleImageSize: rozmiar wygenerowanego obrazu. Ta funkcja jest obsługiwana tylko w przypadku modeli Standard i Ultra. Obsługiwane wartości to 1K2K. Wartość domyślna to 1K.
  • aspectRatio: zmienia format obrazu wygenerowanego przez AI. Obsługiwane wartości to "1:1", "3:4", "4:3", "9:16""16:9". Wartość domyślna to "1:1".
  • personGeneration: zezwolenie modelowi na generowanie obrazów osób; Obsługiwane są te wartości:

    • "dont_allow": blokowanie generowania obrazów przedstawiających ludzi.
    • "allow_adult": generować obrazy przedstawiające osoby dorosłe, ale nie dzieci; Jest to ustawienie domyślne.
    • "allow_all": generować obrazy przedstawiające dorosłych i dzieci;

Przewodnik po promptach w usłudze Imagen

W tej sekcji przewodnika po Imagen dowiesz się, jak modyfikowanie promptu zamiany tekstu na obraz może dać różne wyniki. Znajdziesz tu też przykłady obrazów, które możesz utworzyć.

Podstawowe informacje o pisaniu promptów

Dobry prompt jest opisowy i jasny, a także zawiera odpowiednie słowa kluczowe i modyfikatory. Zacznij od określenia tematu, kontekstustylu.

Prompt z podkreślonym tematem, kontekstem i stylem
Tekst obrazu: Szkic (styl) nowoczesnego budynku mieszkalnego (obiekt) otoczonego wieżowcami (kontekst i tło).
  1. Temat: pierwszą rzeczą, o której należy pomyśleć w przypadku każdego prompta, jest temat, czyli obiekt, osoba, zwierzę lub sceneria, które mają się znaleźć na obrazie.

  2. Kontekst i tło: równie ważne jest tło lub kontekst, w którym umieścisz obiekt. Spróbuj umieścić fotografowany obiekt na różnych tłach. Na przykład studio z białym tłem, plener lub wnętrze.

  3. Styl: na koniec dodaj styl obrazu, który chcesz uzyskać. Style może być ogólny (obraz, zdjęcie, szkic) lub bardzo szczegółowy (pastel, rysunek węglem, izometryczny obraz 3D). Możesz też łączyć style.

Po napisaniu pierwszej wersji prompta dopracuj go, dodając więcej szczegółów, aż uzyskasz oczekiwany obraz. Iteracja jest ważna. Zacznij od podstawowego pomysłu, a potem dopracowuj go i rozwijaj, aż wygenerowany obraz będzie zbliżony do Twojej wizji.

Przykładowy fotorealistyczny obraz 1
Prompt: A park in the spring next to a lake
Przykładowy fotorealistyczny obraz 2
Prompt: Park wiosną nad jeziorem, słońce zachodzi nad jeziorem, złota godzina
przykładowy fotorealistyczny obraz 3
Prompt: Park wiosną nad jeziorem, słońce zachodzi nad jeziorem, złota godzina, czerwone polne kwiaty

Modele Imagen mogą przekształcać Twoje pomysły w szczegółowe obrazy, niezależnie od tego, czy prompty są krótkie, czy długie i szczegółowe. Doprecyzuj swoją wizję, dodając szczegóły, aż uzyskasz idealny rezultat.

Krótkie prompty pozwalają szybko wygenerować obraz.

Przykład krótkiego prompta w Imagen 3
Prompt: close-up photo of a woman in her 20s, street photography, movie still, muted orange warm tones

Dłuższe prompty pozwalają dodawać szczegółowe informacje i budować obraz.

Przykład długiego prompta w Imagen 3
Prompt: captivating photo of a woman in her 20s utilizing a street photography style. Obraz powinien wyglądać jak kadr z filmu z przytłumionymi pomarańczowymi ciepłymi tonami.

Dodatkowe wskazówki dotyczące pisania promptów w usłudze Imagen:

  • Używaj opisowego języka: używaj szczegółowych przymiotników i przysłówków, aby stworzyć dla Imagen wyraźny obraz.
  • Podaj kontekst: w razie potrzeby podaj dodatkowe informacje, które pomogą AI zrozumieć Twoje pytanie.
  • Odwoływanie się do konkretnych artystów lub stylów: jeśli masz na myśli konkretną estetykę, odwoływanie się do konkretnych artystów lub ruchów artystycznych może być pomocne.
  • Korzystaj z narzędzi do tworzenia promptów: rozważ użycie narzędzi lub zasobów do tworzenia promptów, które pomogą Ci udoskonalić prompty i uzyskać optymalne wyniki.
  • Poprawianie szczegółów twarzy na zdjęciach osobistych i grupowych: określ szczegóły twarzy jako główny element zdjęcia (np. użyj w prompcie słowa „portret”).

Generowanie tekstu na obrazach

Modele Imagen mogą dodawać tekst do obrazów, co otwiera więcej możliwości kreatywnego generowania obrazów. Aby w pełni wykorzystać tę funkcję, postępuj zgodnie z tymi wskazówkami:

  • Iteracyjne generowanie obrazów: może być konieczne ponowne generowanie obrazów, dopóki nie uzyskasz pożądanego efektu. Integracja tekstu w Imagen wciąż się rozwija, a czasami najlepsze wyniki uzyskuje się po kilku próbach.
  • Krótko i zwięźle: aby uzyskać optymalne wyniki, ogranicz tekst do maksymalnie 25 znaków.
  • Kilka wyrażeń: eksperymentuj z 2 lub 3 różnymi wyrażeniami, aby podać dodatkowe informacje. Aby uzyskać bardziej przejrzyste kompozycje, unikaj przekraczania 3 wyrażeń.

    Przykład generowania tekstu przez Imagen 3
    Prompt: Plakat z tekstem „Summerland” napisanym pogrubioną czcionką jako tytuł. Pod tym tekstem znajduje się slogan „Summer never felt so good”.
  • Umieszczenie tekstu: Imagen może próbować umieścić tekst zgodnie z instrukcjami, ale mogą wystąpić odchylenia. Ta funkcja jest stale ulepszana.

  • Styl czcionki Inspire: określ ogólny styl czcionki, aby subtelnie wpłynąć na wybory Imagen. Nie polegaj na dokładnym odwzorowaniu czcionki, ale spodziewaj się kreatywnych interpretacji.

  • Rozmiar czcionki: określ rozmiar czcionki lub ogólny wskaźnik rozmiaru (np. mały, średni, duży), aby wpłynąć na generowanie rozmiaru czcionki.

Parametryzacja promptów

Aby lepiej kontrolować wyniki, możesz sparametryzować dane wejściowe w Imagen. Załóżmy na przykład, że chcesz, aby klienci mogli generować logo dla swojej firmy, i chcesz mieć pewność, że logo są zawsze generowane na jednolitym tle. Chcesz też ograniczyć opcje, które klient może wybrać z menu.

W tym przykładzie możesz utworzyć prompt z parametrami podobny do tego:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

W niestandardowym interfejsie użytkownika klient może wprowadzać parametry za pomocą menu, a wybrana wartość wypełnia prompt, który otrzymuje Imagen.

Na przykład:

  1. Prompt: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Przykład parametryzacji prompta w Imagen 3 – 1

  2. Prompt: A modern logo for a software company on a solid color background. Include the text Silo.

    Przykład parametryzacji prompta w Imagen 3 – 2

  3. Prompt: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Imagen 3 – przykład parametryzacji prompta 3

Zaawansowane techniki pisania promptów

Skorzystaj z tych przykładów, aby tworzyć bardziej szczegółowe prompty na podstawie atrybutów, takich jak deskryptory fotografii, kształty i materiały, historyczne kierunki w sztuce oraz modyfikatory jakości obrazu.

Fotografia

  • Prompt zawiera: „Zdjęcie…”

Aby użyć tego stylu, zacznij od słów kluczowych, które wyraźnie informują Imagen, że szukasz zdjęcia. Rozpocznij prompta od słów „Zdjęcie”. . .". Przykład:

Przykładowy fotorealistyczny obraz 1
Prompt: Zdjęcie ziaren kawy w kuchni na drewnianej powierzchni
Przykładowy fotorealistyczny obraz 2
Prompt: Zdjęcie batona czekoladowego na blacie kuchennym
przykładowy fotorealistyczny obraz 3
Prompt: Zdjęcie nowoczesnego budynku z wodą w tle

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 3.

Modyfikatory fotograficzne

W przykładach poniżej znajdziesz kilka modyfikatorów i parametrów związanych z fotografią. Możesz łączyć ze sobą wiele modyfikatorów, aby mieć większą kontrolę.

  1. Camera Proximityzbliżenie, zdjęcie z daleka

    zdjęcie z bliska wykonane aparatem,
    Prompt: Zbliżenie ziaren kawy
    pomniejszone zdjęcie z kamery
    Prompt: Oddalone zdjęcie małej torebki z
    ziarnami kawy w nieuporządkowanej kuchni

  2. Pozycja kamery – z powietrza, z dołu

    przykładowe zdjęcie lotnicze
    Prompt: zdjęcie lotnicze miasta z wieżowcami
    Przykładowe zdjęcie z widokiem od dołu
    Prompt: Zdjęcie korony drzew w lesie z błękitnym niebem z perspektywy od dołu
  3. Oświetlenie – naturalne, dramatyczne, ciepłe, zimne

    Przykładowe zdjęcie z naturalnym oświetleniem
    Prompt: studio photo of a modern arm chair, natural lighting
    Zdjęcie z dramatycznym oświetleniem
    Prompt: studio photo of a modern arm chair, dramatic lighting
  4. Ustawienia aparatu – rozmycie ruchu, miękka ostrość, bokeh, portret

    Przykładowe zdjęcie z rozmyciem ruchu
    Prompt: zdjęcie miasta z wieżowcami zrobione z wnętrza samochodu z rozmyciem w ruchu
    Przykładowy obraz z efektem nieostrości
    Prompt: nieostre zdjęcie mostu w mieście nocą
  5. Rodzaje obiektywów – 35 mm, 50 mm, rybie oko, szerokokątny, makro

    Przykładowe zdjęcie zrobione obiektywem makro
    Prompt: zdjęcie liścia, obiektyw makro
    Przykładowe zdjęcie zrobione obiektywem typu rybie oko
    Prompt: street photography, new york city, fisheye lens
  6. Rodzaje filmów – czarno-białe, polaroidowe

    Przykładowe zdjęcie polaroidowe
    Prompt: zdjęcie polaroidowe psa w okularach przeciwsłonecznych
    przykładowe zdjęcie czarno-białe,
    Prompt: czarno-białe zdjęcie psa w okularach przeciwsłonecznych

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 3.

Ilustracje i sztuka

  • Prompt zawiera: „A painting of...sketch z …”

Style graficzne obejmują zarówno monochromatyczne style, takie jak szkice ołówkiem, jak i hiperrealistyczne grafiki cyfrowe. Na przykład te obrazy zostały wygenerowane na podstawie tego samego prompta, ale w różnych stylach:

„Zdjęcie [art style or creation technique] kanciastego, sportowego sedana elektrycznego z wieżowcami w tle”

przykładowe obrazy artystyczne,
Prompt: Rysunek techniczny ołówkiem przedstawiający kanciasty...
przykładowe obrazy artystyczne,
Prompt: A charcoal drawing of an angular...
przykładowe obrazy artystyczne,
Prompt: Rysunek kredkami przedstawiający kanciasty...
przykładowe obrazy artystyczne,
Prompt: A pastel painting of an angular...
przykładowe obrazy artystyczne,
Prompt: Cyfrowa grafika przedstawiająca kanciasty...
przykładowe obrazy artystyczne,
Prompt: Plakat w stylu art déco przedstawiający kanciasty...

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 2.

Kształty i materiały
  • Prompt zawiera: „...wykonany z...”, „…w kształcie…”

Jedną z zalet tej technologii jest możliwość tworzenia obrazów, które w inny sposób byłyby trudne lub niemożliwe do uzyskania. Możesz na przykład odtworzyć logo firmy w różnych materiałach i teksturach.

Przykład kształtów i materiałów 1
Prompt: torba sportowa zrobiona z sera
Przykład kształtów i materiałów 2
Prompt: neon tubes in the shape of a bird
kształty i materiały – obraz 3
Prompt: fotel z papieru, zdjęcie studyjne, styl origami

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 3.

Odwołania do sztuki historycznej

  • Prompt zawiera: „…w stylu…”

Niektóre style stały się z biegiem lat kultowe. Oto kilka pomysłów na historyczne style malarstwa lub sztuki, które możesz wypróbować.

„wygeneruj obraz w stylu [art period or movement] : farma wiatrowa”

przykładowy obraz impresjonizmu
Prompt: wygeneruj obraz w stylu impresjonistycznego obrazu: farma wiatrowa
renesansowy przykład obrazu
Prompt: wygeneruj obraz w stylu renesansowego obrazu: farma wiatrowa
przykładowy obraz pop-art
Prompt: wygeneruj obraz w stylu pop-artu: farma wiatrowa

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 3.

Modyfikatory jakości obrazu

Niektóre słowa kluczowe mogą informować model, że szukasz zasobu wysokiej jakości. Przykłady modyfikatorów jakości:

  • Ogólne modyfikatory – wysoka jakość, piękny, stylizowany
  • Zdjęcia – 4K, HDR, zdjęcie studyjne
  • Sztuka, ilustracja – profesjonalna, szczegółowa

Poniżej znajdziesz kilka przykładów promptów bez modyfikatorów jakości i tych samych promptów z modyfikatorami jakości.

Przykładowy obraz kukurydzy bez modyfikatorów
Prompt (bez modyfikatorów jakości): zdjęcie łodygi kukurydzy
Przykładowy obraz kukurydzy z modyfikatorami
Prompt (z modyfikatorami jakości): piękny obraz HDR w rozdzielczości 4K
kukurydzy zrobiony przez
profesjonalnego fotografa

Źródło obrazu: każdy obraz został wygenerowany przy użyciu odpowiedniego prompta tekstowego w modelu Imagen 3.

Formaty obrazu

Generowanie obrazów w Imagen umożliwia ustawienie 5 różnych proporcji obrazu.

  1. Kwadrat (1:1, domyślny) – standardowe zdjęcie kwadratowe. Ten format jest często używany w postach w mediach społecznościowych.
  2. Pełny ekran (4:3) – ten format jest często używany w mediach i filmach. Jest to też format większości starszych telewizorów (nie panoramicznych) i aparatów średnioformatowych. Obejmuje większą część sceny w poziomie (w porównaniu z formatem 1:1), dlatego jest preferowanym formatem w fotografii.

    przykład formatu obrazu
    Prompt: zbliżenie na palce muzyka grającego na pianinie, czarno-biały film, vintage (format obrazu 4:3)
    przykład formatu obrazu
    Prompt: Profesjonalne zdjęcie studyjne frytek do ekskluzywnej restauracji w stylu magazynu kulinarnego (format obrazu 4:3)
  3. Pełny ekran w orientacji pionowej (3:4) – pełnoekranowy format obrazu obrócony o 90 stopni. Dzięki temu możesz uchwycić więcej sceny w pionie niż w przypadku formatu 1:1.

    przykład formatu obrazu
    Prompt: kobieta wędrująca po górach, zbliżenie na jej buty odbijające się w kałuży, w tle duże góry, w stylu reklamy, dramatyczne ujęcia (format obrazu 3:4)
    przykład formatu obrazu
    Prompt: ujęcie z lotu ptaka przedstawiające rzekę płynącą w górę mistycznej doliny (format obrazu 3:4)
  4. Panoramiczny (16:9) – ten format zastąpił format 4:3 i jest obecnie najpopularniejszym formatem obrazu w telewizorach, monitorach i ekranach telefonów komórkowych (w orientacji poziomej). Użyj tego formatu, jeśli chcesz uchwycić większą część tła (np. malownicze krajobrazy).

    przykład formatu obrazu
    Prompt: a man wearing all white clothing sitting on the beach, close up, golden hour lighting (16:9 aspect ratio)
  5. Pionowa (9:16) – ten format jest panoramiczny, ale obrócony. Jest to stosunkowo nowy format obrazu, który zyskał popularność dzięki aplikacjom z krótkimi filmami (np. YouTube Shorts). Używaj tej opcji w przypadku wysokich obiektów o wyraźnej orientacji pionowej, takich jak budynki, drzewa, wodospady lub inne podobne obiekty.

    przykład formatu obrazu
    Prompt: cyfrowa wizualizacja ogromnego, nowoczesnego, wspaniałego i epickiego drapacza chmur z pięknym zachodem słońca w tle (format obrazu 9:16)

Fotorealistyczne obrazy

Różne wersje modelu generowania obrazów mogą oferować połączenie wyjść artystycznych i fotorealistycznych. W promptach używaj poniższych sformułowań, aby generować bardziej fotorealistyczne wyniki na podstawie tematu, który chcesz wygenerować.

Przypadek użycia Rodzaj obiektywu Ogniskowe Informacje dodatkowe
Osoby (portrety) Obiektyw stałoogniskowy, zoom 24-35mm film czarno-biały, film noir, głębia ostrości, duotone (wymień 2 kolory)
Jedzenie, owady, rośliny (obiekty, martwa natura) Makro 60-105mm Wysoka szczegółowość, precyzyjne ustawianie ostrości, kontrolowane oświetlenie
Sport, dzika przyroda (ruch) Powiększenie teleobiektywu 100-400mm Krótki czas otwarcia migawki, śledzenie akcji lub ruchu
Astronomiczne, krajobrazowe (szerokokątne) Szerokokątny 10-24mm długi czas naświetlania, ostre ustawienie ostrości, długi czas naświetlania, gładka woda lub chmury;
Portrety
Przypadek użycia Rodzaj obiektywu Ogniskowe Informacje dodatkowe
Osoby (portrety) Obiektyw stałoogniskowy, zoom 24-35mm film czarno-biały, film noir, głębia ostrości, duotone (wymień 2 kolory)

Korzystając z kilku słów kluczowych z tabeli, Imagen może wygenerować te portrety:

przykład fotografii portretowej przykład fotografii portretowej przykład fotografii portretowej przykład fotografii portretowej

Prompt: Kobieta, portret 35 mm, duotony w odcieniach niebieskiego i szarego
Model: imagen-3.0-generate-002

przykład fotografii portretowej przykład fotografii portretowej przykład fotografii portretowej przykład fotografii portretowej

Prompt: Kobieta, portret 35 mm, film noir
Model: imagen-3.0-generate-002

Obiekty
Przypadek użycia Rodzaj obiektywu Ogniskowe Informacje dodatkowe
Jedzenie, owady, rośliny (obiekty, martwa natura) Makro 60-105mm Wysoka szczegółowość, precyzyjne ustawianie ostrości, kontrolowane oświetlenie

Korzystając z kilku słów kluczowych z tabeli, Imagen może wygenerować te obrazy obiektów:

przykład fotografii obiektu przykład fotografii obiektu przykład fotografii obiektu przykład fotografii obiektu

Prompt: leaf of a prayer plant, macro lens, 60mm
Model: imagen-3.0-generate-002

przykład fotografii obiektu przykład fotografii obiektu przykład fotografii obiektu przykład fotografii obiektu

Prompt: a plate of pasta, 100mm Macro lens
Model: imagen-3.0-generate-002

Ruch
Przypadek użycia Rodzaj obiektywu Ogniskowe Informacje dodatkowe
Sport, dzika przyroda (ruch) Powiększenie teleobiektywu 100-400mm Krótki czas otwarcia migawki, śledzenie akcji lub ruchu

Korzystając z kilku słów kluczowych z tabeli, Imagen może wygenerować te obrazy w ruchu:

przykład fotografii ruchu przykład fotografii ruchu przykład fotografii ruchu przykład fotografii ruchu

Prompt: zwycięskie przyłożenie, krótki czas otwarcia migawki, śledzenie ruchu
Model: imagen-3.0-generate-002

przykład fotografii ruchu przykład fotografii ruchu przykład fotografii ruchu przykład fotografii ruchu

Prompt: Jeleń biegnący po lesie, szybka migawka, śledzenie ruchu
Model: imagen-3.0-generate-002

Szerokokątny
Przypadek użycia Rodzaj obiektywu Ogniskowe Informacje dodatkowe
Astronomiczne, krajobrazowe (szerokokątne) Szerokokątny 10-24mm długi czas naświetlania, ostre ustawienie ostrości, długi czas naświetlania, gładka woda lub chmury;

Korzystając z kilku słów kluczowych z tabeli, Imagen może wygenerować te zdjęcia szerokokątne:

Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej

Prompt: an expansive mountain range, landscape wide angle 10mm
Model: imagen-3.0-generate-002

Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej Przykład fotografii szerokokątnej

Prompt: zdjęcie księżyca, fotografia astronomiczna, szeroki kąt 10 mm
Model: imagen-3.0-generate-002

Wersje modelu

Imagen 4

Właściwość Opis
Kod modelu

Gemini API

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001
imagen-4.0-fast-generate-001

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Obrazy

Limity tokenów[*]

Limit tokenów wejściowych

480 tokenów (tekst)

Obrazy wyjściowe

1–4 (Ultra/Standard/Fast)

Ostatnia aktualizacja Czerwiec 2025 r.

Imagen 3

Właściwość Opis
Kod modelu

Gemini API

imagen-3.0-generate-002

Obsługiwane typy danych

Wejście

Tekst

Dane wyjściowe

Obrazy

Limity tokenów[*]

Limit tokenów wejściowych

Nie dotyczy

Obrazy wyjściowe

Maksymalnie 4

Ostatnia aktualizacja Luty 2025 r.