Gemini 2.5 Pro Preview è ora disponibile per l'uso in produzione. Scopri di più

Questa pagina è stata tradotta dall'API Cloud Translation.

Genera immagini

L'API Gemini supporta la generazione di immagini utilizzando Gemini 2.0 Flash Experimental e Imagen 3. Questa guida ti aiuta a iniziare a utilizzare entrambi i modelli.

Per indicazioni sui prompt delle immagini, consulta la sezione Guida ai prompt di Imagen.

Prima di iniziare

Prima di chiamare l'API Gemini, assicurati di aver installato l'SDK che preferisci e di avere configurato e pronto all'uso una chiave API Gemini.

Generare immagini utilizzando Gemini

Gemini 2.0 Flash Experimental supporta la possibilità di generare testo e immagini in linea. In questo modo puoi utilizzare Gemini per modificare le immagini in modo conversazionale o generare output con testo intrecciato (ad esempio, generare un post del blog con testo e immagini in un unico turno). Tutte le immagini generate includono una filigrana SynthID e le immagini in Google AI Studio includono anche una filigrana visibile.

L'esempio seguente mostra come utilizzare Gemini 2.0 per generare output di testo e immagini:

PythonJavaScriptREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png

Immagine creata con l'IA di un maiale volante fantastico — Immagine creata con l'IA di un fantastico maiale volante

A seconda del prompt e del contesto, Gemini genererà contenuti in diverse modalità (da testo a immagine, da testo a immagine e testo e così via). Ecco alcuni esempi:

Da testo a immagine
- Esempio di prompt: "Genera un'immagine della Torre Eiffel con fuochi d'artificio sullo sfondo".
Testo in immagini e testo (interlacciati)
- Esempio di prompt: "Genera una ricetta illustrata per una paella".
Immagini e testo in immagini e testo (interlacciati)
- Prompt di esempio: (con un'immagine di una stanza arredata) "Quali altri divani di colore andrebbero bene nel mio spazio? Puoi aggiornare l'immagine?"
Modifica delle immagini (testo e immagine a immagine)
- Prompt di esempio: "Modifica questa immagine in modo che assomigli a un cartone animato"
- Esempio di prompt: [immagine di un gatto] + [immagine di un cuscino] + "Crea un punto croce del mio gatto su questo cuscino".
Modifica di immagini in più turni (chat)
- Prompt di esempio: [carica un'immagine di un'auto blu.] "Trasforma questa auto in un cabrio." "Ora cambia il colore in giallo."

Modifica delle immagini con Gemini

Per eseguire l'editing delle immagini, aggiungi un'immagine come input. L'esempio seguente mostra il caricamento di immagini con codifica base64. Per più immagini e payload più grandi, consulta la sezione Input immagine.

PythonJavaScriptREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Limitazioni

Per un rendimento ottimale, utilizza le seguenti lingue: EN, es-MX, ja-JP, zh-CN, hi-IN.
La generazione di immagini non supporta input audio o video.
La generazione di immagini potrebbe non essere sempre attivata:
- Il modello potrebbe restituire solo testo. Prova a chiedere esplicitamente le uscite di immagini (ad es. "genera un'immagine", "fornisci le immagini man mano", "aggiorna l'immagine").
- Il modello potrebbe interrompere la generazione a metà. Riprova o prova con un altro prompt.
Quando generi il testo per un'immagine, Gemini funziona al meglio se generi prima il testo e poi chiedi un'immagine con il testo.

Scelta di un modello

Quale modello dovresti utilizzare per generare le immagini? Dipende dal tuo caso d'uso.

Gemini 2.0 è ideale per produrre immagini pertinenti al contesto, combinare testo e immagini, incorporare la conoscenza del mondo e ragionare sulle immagini. Puoi utilizzarlo per creare immagini accurate e pertinenti dal punto di vista del contesto incorporate in lunghe sequenze di testo. Puoi anche modificare le immagini in modo conversazionale, utilizzando un linguaggio naturale, mantenendo il contesto durante la conversazione.

Se la qualità delle immagini è la tua massima priorità, Imagen 3 è una scelta migliore. Imagen 3 eccelle nel fotorealismo, nei dettagli artistici e in stili artistici specifici come l'impressionismo o gli anime. Imagen 3 è una buona scelta anche per attività di modifica delle immagini specializzate, come l'aggiornamento degli sfondi dei prodotti, l'aumento della dimensione delle immagini e l'inserimento di branding e stile nelle immagini. Puoi utilizzare Imagen 3 per creare loghi o altri design di prodotti con brand.

Genera immagini utilizzando Imagen 3

L'API Gemini fornisce l'accesso a Imagen 3, il modello di conversione da testo a immagine di altissima qualità di Google, che offre una serie di funzionalità nuove e migliorate. Imagen 3 può:

Genera immagini con dettagli migliori, illuminazione più ricca e meno artefatti che distraggono rispetto ai modelli precedenti
Comprendere i prompt scritti in linguaggio naturale
Genera immagini in una vasta gamma di formati e stili
Eseguire il rendering del testo in modo più efficace rispetto ai modelli precedenti

PythonJavaScriptREST

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

Immagine creata con l'IA di due coniglietti in cucina — Immagine di due coniglietti pelosi in cucina creata con l'IA

Al momento Imagen supporta solo i prompt in inglese e i seguenti parametri:

Parametri del modello Imagen

Le convenzioni di denominazione variano in base al linguaggio di programmazione.

numberOfImages: il numero di immagini da generare, da 1 a 4 (inclusi). Il valore predefinito è 4.
aspectRatio: modifica le proporzioni dell'immagine generata. I valori supportati sono "1:1", "3:4", "4:3", "9:16" e "16:9". Il valore predefinito è "1:1".
personGeneration: consenti al modello di generare immagini di persone. Sono supportati i seguenti valori:
- "DONT_ALLOW": blocca la generazione di immagini di persone.
- "ALLOW_ADULT": genera immagini di adulti, ma non di bambini. Questa è l'impostazione predefinita.

Guida ai prompt di Imagen

Questa sezione della guida di Imagen mostra come la modifica di un prompt da testo a immagine può produrre risultati diversi, oltre a esempi di immagini che puoi creare.

Nozioni di base sulla scrittura dei prompt

Un buon prompt è descrittivo e chiaro e utilizza parole chiave e modi di dire significativi. Inizia pensando al soggetto, al contesto e allo stile.

Prompt con soggetto, contesto e stile evidenziati — Testo dell'immagine: uno *schizzo* (**stile**) di un *condominio moderno* (**soggetto**) circondato da *grattacieli* (**contesto e sfondo**).

Soggetto: la prima cosa a cui pensare con qualsiasi prompt è il soggetto: l'oggetto, la persona, l'animale o lo scenario di cui vuoi un'immagine.
Contesto e sfondo: altrettanto importante è lo sfondo o il contesto in cui verrà inserito il soggetto. Prova a posizionare il soggetto su diversi tipi di sfondo. Ad esempio, uno studio con sfondo bianco, all'aperto o in ambienti interni.
Stile:infine, aggiungi lo stile dell'immagine che preferisci. Gli stili possono essere generici (pittura, fotografia, schizzi) o molto specifici (acquerello, disegno a carboncino, 3D isometrico). Puoi anche combinare gli stili.

Dopo aver scritto una prima versione del prompt, perfezionalo aggiungendo più dettagli finché non ottieni l'immagine che vuoi. L'iterazione è importante. Inizia definendo l'idea di base, poi perfezionala ed espandila fino a quando l'immagine generata non sarà vicina alla tua visione.

immagine di esempio fotorealistica 1 — Prompt: un parco in primavera vicino a un lago

Immagine di esempio fotorealistica 2 — Prompt: un parco in primavera vicino a un lago, **il sole tramonta sul lago, ora d'oro**

immagine di esempio fotorealistica 3 — Prompt: un parco in primavera accanto a un lago, **il sole che tramonta sul lago, ora d'oro, fiori selvatici rossi**

Imagen 3 può trasformare le tue idee in immagini dettagliate, indipendentemente dal fatto che i prompt siano brevi o lunghi e dettagliati. Perfeziona la tua visione tramite prompt iterativi, aggiungendo dettagli fino a ottenere il risultato perfetto.

I prompt brevi ti consentono di generare un'immagine rapidamente.

Esempio di prompt di Imagen 3 — Prompt: foto in primo piano di una donna sui 20 anni, fotografia di strada, fotogramma di un film, tonalità calde arancioni smorzate

I prompt più lunghi ti consentono di aggiungere dettagli specifici e creare la tua immagine.

Esempio di prompt lungo di Imagen 3 — Suggerimento: foto accattivante di una donna sui 20 anni in stile fotografia di strada. L'immagine deve avere l'aspetto di una foto di un film con sfumature arancioni opache e calde.

Altri consigli per la scrittura dei prompt di Imagen:

Utilizza un linguaggio descrittivo: utilizza aggettivi e avverbi dettagliati per fornire un'immagine chiara per l'immagine 3.
Fornisci il contesto: se necessario, includi informazioni di base per aiutare l'IA a comprendere.
Fai riferimento a stili o artisti specifici: se hai in mente un'estetica particolare, può essere utile fare riferimento a movimenti artistici o artisti specifici.
Utilizza gli strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali.
Migliorare i dettagli del viso nelle immagini personali e di gruppo:
- Specifica i dettagli del viso come punto focale della foto (ad esempio, utilizza la parola "ritratto" nel prompt).

Generare testo nelle immagini

Imagen può aggiungere testo alle immagini, aprendo nuove possibilità di generazione di immagini creative. Segui queste indicazioni per ottenere il massimo da questa funzionalità:

Esegui l'iterazione in tutta sicurezza: potresti dover rigenerare le immagini finché non ottieni il look che preferisci. L'integrazione del testo di Imagen è ancora in fase di sviluppo e a volte più tentativi danno i risultati migliori.
Mantieni breve il testo: limita il testo a 25 caratteri o meno per una generazione ottimale.
Più frasi: fai esperimenti con due o tre frasi distinte per fornire informazioni aggiuntive. Evita di superare tre frasi per composizioni più chiare.

Stimolo: un poster con il testo "Summerland" in grassetto come titolo. Sotto questo testo è riportato lo slogan "L'estate non è mai stata così bella"
Posizionamento guidato: anche se Imagen può tentare di posizionare il testo come indicato, prendi in considerazione occasionali variazioni. Questa funzionalità è in continuo miglioramento.
Stile carattere ispirato: specifica uno stile di carattere generale per influenzare leggermente le scelte di Imagen. Non fare affidamento sulla replica precisa dei caratteri, ma aspettati interpretazioni creative.
Dimensioni carattere: specifica una dimensione del carattere o un'indicazione generale delle dimensioni (ad es. piccolo, medio, grande) per influenzare la generazione delle dimensioni del carattere.

Parametrizzazione dei prompt

Per controllare meglio i risultati di output, potrebbe essere utile parametrizzare gli input in Imagen. Ad esempio, supponiamo che tu voglia che i tuoi clienti possano generare loghi per la loro attività e che tu voglia assicurarti che i loghi vengano sempre generati su uno sfondo a tinta unita. Vuoi anche limitare le opzioni che il cliente può selezionare da un menu.

In questo esempio, puoi creare un prompt parametro simile al seguente:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Nell'interfaccia utente personalizzata, il cliente può inserire i parametri utilizzando un menu e il valore scelto viene inserito nella richiesta ricevuta da Imagen.

Ad esempio:

Prompt: A minimalist logo for a health care company on a solid color background. Include the text Journey.
Prompt: A modern logo for a software company on a solid color background. Include the text Silo.
Prompt: A traditional logo for a baking company on a solid color background. Include the text Seed.

Tecniche avanzate di scrittura dei prompt

Utilizza i seguenti esempi per creare prompt più specifici in base ad attributi come descrizioni di fotografia, forme e materiali, movimenti artistici storici e modificatori della qualità delle immagini.

Fotografia

Il prompt include: "Una foto di…"

Per utilizzare questo stile, inizia con parole chiave che indicano chiaramente a Imagen che stai cercando una fotografia. Inizia i prompt con "Una foto di. . .". Ad esempio:

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.}

Modificatori per la fotografia

Negli esempi seguenti puoi vedere diversi parametri e modificatori specifici per la fotografia. Puoi combinare più modificatori per un controllo più preciso.

Prossimità fotocamera: primo piano, foto scattata da lontano

immagine di esempio di fotocamera in primo piano — Prompt: una foto **in primo piano** di chicchi di caffè

Immagine di esempio della fotocamera con zoom ridotto — Prompt: una foto con **lo zoom ridotto** di una piccola busta di
chicchi di caffè in una cucina disordinata

Posizione videocamera: aerea, dall'alto

Prompt: foto aerea di una città urbana con grattacieli

Suggerimento: una foto della chioma di una foresta con cielo blu da sotto

Illuminazione: naturale, drammatica, calda, fredda

immagine di esempio con illuminazione naturale — Suggerimento: foto in studio di una poltrona moderna, **illuminazione naturale**

immagine di esempio di illuminazione drammatica — Suggerimento: foto in studio di una poltrona moderna, **illuminazione drammatica**

Impostazioni della fotocamera - sfocatura movimento, sfocatura, bokeh, ritratto

immagine di esempio di sfocatura movimento — Prompt: foto di una città con grattacieli dall'interno di un'auto con **sfocatura in movimento**

immagine di esempio con sfocatura diffusa — Prompt: fotografia con **sfocatura** di un ponte in una città urbana di notte

Tipi di obiettivi: 35 mm, 50 mm, fisheye, grandangolare, macro

Prompt: foto di una foglia, obiettivo macro

Prompt: street photography, New York City, obiettivo fisheye
Tipi di pellicole: bianco e nero, Polaroid

Prompt: un ritratto Polaroid di un cane con gli occhiali da sole

Prompt: foto in bianco e nero di un cane con gli occhiali da sole

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.}

Illustrazione e arte

Il prompt include: "Un painting di…", "Un sketch di…"

Gli stili artistici variano da quelli monocromatici, come gli schizzi a matita, all'arte digitale iperrealistica. Ad esempio, le seguenti immagini utilizzano lo stesso prompt con stili diversi:

"Un [art style or creation technique] di una berlina elettrica sportiva squadrata con grattacieli sullo sfondo"

immagini di esempio di artwork — Prompt: un **disegno tecnico a matita** di un...

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 2.}

Forme e materiali

Il prompt include: "…realizzato in…", "…a forma di…"

Uno dei punti di forza di questa tecnologia è che puoi creare immagini che altrimenti sarebbero difficili o impossibili. Ad esempio, puoi ricreare il logo della tua azienda in diversi materiali e trame.

Immagine di esempio di forme e materiali 1 — Stimolo: un borsone **fatto di** formaggio

Immagine di esempio di forme e materiali 2 — Prompt: tubi al neon **a forma di** uccello

immagine di esempio di forme e materiali 3 — Stimolo: una poltrona **fatta di carta**, foto in studio, stile origami

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.}

Riferimenti artistici storici

Il prompt include: "…nello stile di…"

Alcuni stili sono diventati iconici nel corso degli anni. Di seguito sono riportate alcune idee di stili artistici o di pittura storica che puoi provare.

"Genera un'immagine nello stile di [art period or movement]: un parco eolico"

impressionism example image — Prompt: genera un'immagine nello stile di *un dipinto impressionista*: un parco eolico

immagine di esempio rinascimentale — Prompt: genera un'immagine nello stile di *un dipinto rinascimentale*: un parco eolico

immagine di esempio di pop art — Prompt: genera un'immagine nello stile della *pop art*: un parco eolico

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.}

Modificatori della qualità delle immagini

Determinate parole chiave possono comunicare al modello che stai cercando un asset di alta qualità. Ecco alcuni esempi di modificatori della qualità:

Modificatori generali: di alta qualità, belli, stilizzati
Foto: 4K, HDR, foto professionali
Arte, illustrazione: di un professionista, dettagliata

Di seguito sono riportati alcuni esempi di prompt senza modificatori della qualità e lo stesso prompt con modificatori della qualità.

immagine di esempio di mais senza modificatori — Prompt (nessun modificatore della qualità): una foto di un gambo di mais

Immagine di esempio di mais con modificatori — Suggerimento (con modificatori della qualità): **bellissima foto**
HDR 4K di una pannocchia **scattata da un fotografo professionista**

^{Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.}

Proporzioni

La generazione di immagini di Imagen 3 consente di impostare cinque proporzioni distinte delle immagini.

Quadrato (1:1, predefinito): una foto quadrata standard. Gli utilizzi comuni di questo formato includono i post sui social media.

A schermo intero (4:3): queste proporzioni sono comunemente utilizzate nei media o nei film. Sono anche le dimensioni della maggior parte delle vecchie TV (non widescreen) e delle fotocamere medio formato. Cattura più della scena in orizzontale (rispetto a 1:1), pertanto è il formato preferito per la fotografia.

esempio di proporzioni — Prompt: primo piano delle dita di un musicista che suona il piano, film in bianco e nero, vintage (formato 4:3)

Verticale a schermo intero (3:4): si tratta delle proporzioni a schermo intero ruotate di 90 gradi. In questo modo puoi acquisire più della scena in verticale rispetto alle proporzioni 1:1.

Widescreen (16:9): questa proporzione ha sostituito il formato 4:3 ed è ora la più comune per TV, monitor e schermi di cellulari (orizzontale). Utilizza queste proporzioni quando vuoi catturare più dello sfondo (ad esempio paesaggi panoramici).

Suggerimento: un uomo vestito di bianco seduto sulla spiaggia, primo piano, illuminazione dell'ora d'oro (proporzioni 16:9)
Verticale (9:16): queste proporzioni sono widescreen, ma ruotate. Si tratta di un'apologia relativamente nuova, resa popolare dalle app di video nel formato breve (ad esempio YouTube Shorts). Utilizzalo per oggetti alti con forti orientamenti verticali, come edifici, alberi, cascate o altri oggetti simili.

Prompt: un rendering digitale di un grattacielo enorme, moderno, grandioso, epico con un bellissimo tramonto sullo sfondo (proporzioni 9:16)

Immagini fotorealistiche

Versioni diverse del modello di generazione delle immagini potrebbero offrire un mix di output artistici e fotorealistici. Utilizza le seguenti formulazioni nei prompt per generare un output più fotorealistico, in base all'oggetto che vuoi generare.

Caso d'uso	Tipo di obiettivo	Lunghezza focale	Ulteriori dettagli
Persone (ritratti)	Primo, zoom	24-35mm	film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori)
Cibo, insetti, piante (oggetti, nature morte)	Macro	60-105mm	Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata
Sport, fauna selvatica (in movimento)	Zoom teleobiettivo	100-400mm	Tempo di esposizione rapido, monitoraggio di azioni o movimenti
Astronomico, orizzontale (grandangolare)	Grandangolare	10-24mm	Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce

Ritratti

Caso d'uso	Tipo di obiettivo	Lunghezza focale	Ulteriori dettagli
Persone (ritratti)	Primo, zoom	24-35mm	film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori)

Utilizzando diverse parole chiave della tabella, Imagen può generare i seguenti ritratti:

Prompt: Una donna, ritratto 35 mm, duotone blu e grigio
Modello: imagen-3.0-generate-002

Prompt: Una donna, ritratto 35 mm, film noir
Modello: imagen-3.0-generate-002

Oggetti

Caso d'uso	Tipo di obiettivo	Lunghezza focale	Ulteriori dettagli
Cibo, insetti, piante (oggetti, nature morte)	Macro	60-105mm	Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini di oggetti:

Prompt: foglia di una pianta di preghiera, obiettivo macro, 60 mm
Modello: imagen-3.0-generate-002

Prompt: un piatto di pasta, obiettivo macro da 100 mm
Modello: imagen-3.0-generate-002

Movimento

Caso d'uso	Tipo di obiettivo	Lunghezza focale	Ulteriori dettagli
Sport, fauna selvatica (in movimento)	Zoom teleobiettivo	100-400mm	Tempo di esposizione rapido, monitoraggio di azioni o movimenti

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini in movimento:

Prompt: un touchdown vincente, tempo di esposizione rapido, monitoraggio dei movimenti
Modello: imagen-3.0-generate-002

Prompt: Un cervo che corre nella foresta, tempo di esposizione rapido, monitoraggio dei movimenti
Modello: imagen-3.0-generate-002

Grandangolare

Caso d'uso	Tipo di obiettivo	Lunghezza focale	Ulteriori dettagli
Astronomico, orizzontale (grandangolo)	Grandangolare	10-24mm	Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce

Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini grandangolari:

Prompt: una vasta catena montuosa, grandangolo orizzontale 10 mm
Modello: imagen-3.0-generate-002

Prompt: una foto della luna, astrofotografia, grandangolo 10 mm
Modello: imagen-3.0-generate-002

Passaggi successivi

Consulta la guida di Veo per scoprire come generare video con l'API Gemini.
Per scoprire di più sui modelli Gemini 2.0, consulta Modelli Gemini e Modelli sperimentali.