Per utilizzare Imagen, devi fornire una descrizione di testo di ciò che vuoi generare. Queste descrizioni sono chiamate prompt e rappresentano il modo principale per comunicare con Imagen.
Questa guida mostra come la modifica di parti di un prompt da testo a immagine può produrre risultati diversi e fornisce esempi di immagini che puoi creare.
Nozioni di base sulla scrittura dei prompt (oggetto, contesto e stile)
Sebbene esistano molti modi per scrivere un buon prompt, l'aggiunta di alcune parole chiave e di alcuni modificatori ti aiuterà ad avvicinarti al tuo obiettivo finale. I prompt non devono essere lunghi o complessi, ma la maggior parte di quelli efficaci è descrittiva e chiara.
Un buon punto di partenza può essere pensare a soggetto, contesto e stile.
![Prompt con oggetto, contesto e stile evidenziati](https://ai.google.dev/static/gemini-api/docs/images/imagen/style-subject-context.png?hl=it)
Soggetto: la prima cosa a cui pensare con qualsiasi prompt è il soggetto: l'oggetto, la persona, l'animale o lo scenario di cui vuoi un'immagine.
Contesto e sfondo: altrettanto importante è lo sfondo o il contesto in cui verrà inserito il soggetto. Prova a posizionare il soggetto su diversi tipi di sfondo. Ad esempio, un'immagine in studio con uno sfondo bianco, all'aperto o in ambienti interni.
Stile:infine, aggiungi lo stile di immagine che preferisci. Gli stili possono essere generici (pittura, fotografia, schizzi) o molto specifici (acquerello, disegno a carboncino, 3D isometrico). Puoi anche combinare gli stili.
Dopo aver scritto una prima versione del prompt, perfezionalo aggiungendo più dettagli finché non ottieni l'immagine che vuoi. L'iterazione è importante. Inizia definendo l'idea di base, poi perfezionala ed espandila finché l'immagine generata non si avvicina alla tua visione.
![]() |
![]() |
![]() |
Scrittura di prompt per Imagen 3
Imagen 3 può trasformare le tue idee in immagini dettagliate, indipendentemente dal fatto che i prompt siano brevi o lunghi e dettagliati. Perfeziona la tua visione tramite prompt iterativi, aggiungendo dettagli fino a ottenere il risultato perfetto.
I prompt brevi ti consentono di generare un'immagine rapidamente. ![]() |
I prompt più lunghi ti consentono di aggiungere dettagli specifici e creare la tua immagine. ![]() |
Suggerimenti aggiuntivi per la scrittura dei prompt di Imagen 3:
- Utilizza un linguaggio descrittivo: utilizza aggettivi e avverbi dettagliati per fornire un'immagine chiara di Imagen 3.
- Fornisci il contesto: se necessario, includi informazioni di base per aiutare l'IA a comprendere.
- Fai riferimento a stili o artisti specifici: se hai in mente un'estetica particolare, può essere utile fare riferimento a movimenti artistici o artisti specifici.
- Utilizza gli strumenti di prompt engineering: valuta la possibilità di esplorare strumenti o risorse di prompt engineering per perfezionare i prompt e ottenere risultati ottimali.
- Migliorare i dettagli del viso nelle immagini personali e di gruppo:
- Specifica i dettagli del viso come punto focale della foto (ad esempio, utilizza la parola "ritratto" nel prompt).
Generare testo nelle immagini
La capacità di Imagen 3 di aggiungere testo alle immagini apre nuove possibilità di generazione di immagini creative. Segui le indicazioni riportate di seguito per ottenere il massimo da questa funzionalità:
- Esegui l'iterazione in tutta sicurezza: potresti dover rigenerare le immagini finché non ottieni il look che preferisci. L'integrazione del testo di Imagen è ancora in fase di sviluppo e a volte più tentativi danno i risultati migliori.
- Mantieni breve il testo: limita il testo a 25 caratteri o meno per una generazione ottimale.
Più frasi: fai esperimenti con due o tre frasi distinte per fornire informazioni aggiuntive. Evita di superare tre frasi per composizioni più chiare.
Stimolo: un poster con il testo "Summerland" in grassetto come titolo. Sotto questo testo è riportato lo slogan "L'estate non è mai stata così bella" Posizionamento guidato: anche se Imagen può tentare di posizionare il testo come indicato, dovresti aspettarti variazioni occasionali. Questa funzionalità è in costante miglioramento.
Stile carattere ispirato: specifica uno stile di carattere generale per influenzare leggermente le scelte di Imagen. Non fare affidamento sulla replica esatta dei caratteri, ma aspettati interpretazioni creative.
Dimensioni carattere: specifica una dimensione del carattere o un'indicazione generale delle dimensioni (ad es. piccolo, medio, grande) per influenzare la generazione delle dimensioni del carattere.
Parametrizzazione dei prompt
Per controllare meglio i risultati di output, potrebbe essere utile parametrizzare gli input in Imagen. Ad esempio, supponiamo che tu voglia che i tuoi clienti possano generare loghi per la loro attività e che tu voglia assicurarti che i loghi vengano sempre generati su uno sfondo di colore a tinta unita. Vuoi anche limitare le opzioni che il cliente può selezionare da un menu.
In questo esempio, puoi creare un prompt parametro simile al seguente:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
Nell'interfaccia utente personalizzata, il cliente può inserire i parametri utilizzando un menu e il valore scelto viene inserito nel prompt ricevuto da Imagen.
Ad esempio:
Prompt:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
Prompt:
A modern logo for a software company on a solid color background. Include the text Silo.
Prompt:
A traditional logo for a baking company on a solid color background. Include the text Seed.
Stile: fotografia
- Il prompt include: "Una foto di…"
Per utilizzare questo stile, inizia con parole chiave che indicano chiaramente a Imagen che stai cercando una fotografia. Inizia i prompt con "Una foto di. . .". Ad esempio:
![]() |
![]() |
![]() |
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.
Stile: illustrazione e arte
- Il prompt include: "Un painting di…", "Un sketch di…"
Gli stili artistici variano da quelli monocromatici, come gli schizzi a matita, all'arte digitale iperrealistica. Ad esempio, le seguenti immagini utilizzano lo stesso prompt con stili diversi:
"Un [art style or creation technique] di una berlina elettrica sportiva angolare con grattacieli sullo sfondo"
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 2.
Tecniche avanzate di scrittura dei prompt
Utilizza i seguenti esempi per creare prompt più specifici in base agli attributi: descrizioni di fotografia, forme e materiali, movimenti artistici storici e modificatori della qualità delle immagini.
Modificatori per la fotografia
Negli esempi seguenti puoi vedere diversi parametri e modificatori specifici per la fotografia. Puoi combinare più modificatori per un controllo più preciso.
Prossimità fotocamera: primo piano, foto scattata da lontano
Prompt: una foto in primo piano di chicchi di caffè Prompt: una foto con lo zoom ridotto di una piccola busta di
chicchi di caffè in una cucina disordinataPosizione videocamera: aerea, dall'alto
Prompt: foto aerea di una città urbana con grattacieli Suggerimento: una foto della chioma di una foresta con cielo blu da sotto Illuminazione: naturale, drammatica, calda, fredda
Suggerimento: foto in studio di una poltrona moderna, illuminazione naturale Suggerimento: foto in studio di una poltrona moderna, illuminazione drammatica Impostazioni della fotocamera - sfocatura in movimento, sfocatura, bokeh, ritratto
Prompt: foto di una città con grattacieli dall'interno di un'auto con sfocatura in movimento Prompt: fotografia con sfocatura di un ponte in una città urbana di notte Tipi di obiettivi: 35 mm, 50 mm, fisheye, grandangolare, macro
Prompt: foto di una foglia, obiettivo macro Prompt: street photography, New York City, obiettivo fisheye Tipi di pellicola: bianco e nero, Polaroid
Prompt: un ritratto Polaroid di un cane con gli occhiali da sole Prompt: foto in bianco e nero di un cane con gli occhiali da sole
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.
Forme e materiali
- Il prompt include: "…realizzato in…", "…a forma di…"
Uno dei punti di forza di questa tecnologia è che puoi creare immagini che altrimenti sarebbero difficili o impossibili da realizzare. Ad esempio, puoi ricreare il logo della tua azienda in diversi materiali e trame.
![]() |
![]() |
![]() |
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.
Riferimenti artistici storici
- Il prompt include: "…nello stile di…"
Alcuni stili sono diventati iconici nel corso degli anni. Di seguito sono riportate alcune idee di stili artistici o di pittura storica che puoi provare.
"Genera un'immagine nello stile di [art period or movement] : un parco eolico"
![]() |
![]() |
![]() |
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.
Modificatori della qualità delle immagini
Alcune parole chiave possono comunicare al modello che stai cercando un asset di alta qualità. Ecco alcuni esempi di modificatori della qualità:
- Modificatori generali: di alta qualità, belli, stilizzati
- Foto: 4K, HDR, foto professionali
- Arte, illustrazione: di un professionista, dettagliata
Di seguito sono riportati alcuni esempi di prompt senza modificatori della qualità e lo stesso prompt con modificatori della qualità.
![]() |
![]() HDR 4K di una pannocchia scattata da un fotografo professionista |
Origine immagine: ogni immagine è stata generata utilizzando il prompt di testo corrispondente con il modello Imagen 3.
Proporzioni
La generazione di immagini di Imagen 3 consente di impostare cinque proporzioni diverse per le immagini.
- Quadrato (1:1, predefinito): una foto quadrata standard. Gli utilizzi comuni di questo formato includono i post sui social media.
A schermo intero (4:3): queste proporzioni sono comunemente utilizzate nei media o nei film. Sono anche le dimensioni della maggior parte delle vecchie TV (non widescreen) e delle fotocamere medio formato. Cattura più della scena in orizzontale (rispetto a 1:1), pertanto è una proporzione preferita per la fotografia.
Prompt: primo piano delle dita di un musicista che suona il piano, film in bianco e nero, vintage (formato 4:3) Prompt: una foto professionale in studio di patatine fritte per un ristorante di alta gamma, nello stile di una rivista di cucina (formato 4:3) Schermo intero verticale (3:4): si tratta delle proporzioni a schermo intero ruotate di 90 gradi. In questo modo puoi acquisire più della scena in verticale rispetto alle proporzioni 1:1.
Stimolo: una donna che fa trekking, primo piano dei suoi stivali riflessi in una pozzanghera, grandi montagne sullo sfondo, nello stile di un annuncio, angolazioni drammatiche (formato 3:4) Prompt: ripresa aerea di un fiume che scorre in una valle mistica (formato 3:4) Widescreen (16:9): questa proporzione ha sostituito 4:3 ed è ora la più comune per TV, monitor e schermi di cellulari (orizzontale). Utilizza queste proporzioni quando vuoi catturare più dello sfondo (ad esempio paesaggi panoramici).
Prompt: un uomo che indossa abiti completamente bianchi seduto sulla spiaggia, primo piano, illuminazione dell'ora d'oro (proporzioni 16:9) Verticale (9:16): queste proporzioni sono widescreen, ma ruotate. Si tratta di un'apologia relativamente nuova, resa popolare dalle app di video nel formato breve (ad esempio YouTube Shorts). Utilizzalo per oggetti alti con forti orientamenti verticali, come edifici, alberi, cascate o altri oggetti simili.
Stimolo: un rendering digitale di un grattacielo enorme, moderno, grandioso, epico con un bellissimo tramonto sullo sfondo (proporzioni 9:16)
Immagini fotorealistiche
Versioni diverse del modello di generazione delle immagini potrebbero offrire una combinazione di output artistici e fotorealistici. Utilizza la seguente formulazione nei prompt per generare un output più fotorealistico, in base all'oggetto che vuoi generare.
Caso d'uso | Tipo di obiettivo | Lunghezza focale | Ulteriori dettagli |
---|---|---|---|
Persone (ritratti) | Primo, zoom | 24-35mm | film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori) |
Cibo, insetti, piante (oggetti, nature morte) | Macro | 60-105mm | Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata |
Sport, fauna selvatica (in movimento) | Zoom teleobiettivo | 100-400mm | Tempo di esposizione rapido, monitoraggio di azioni o movimenti |
Astronomico, orizzontale (grandangolare) | Grandangolare | 10-24mm | Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce |
Ritratti
Caso d'uso | Tipo di obiettivo | Lunghezza focale | Ulteriori dettagli |
---|---|---|---|
Persone (ritratti) | Primo, zoom | 24-35mm | film in bianco e nero, film noir, profondità di campo, duotone (menziona due colori) |
Utilizzando diverse parole chiave della tabella, Imagen può generare i seguenti ritratti.
![]() |
![]() |
![]() |
![]() |
Prompt: Una donna, ritratto 35 mm, duotone blu e grigio
Modello: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Prompt: Una donna, ritratto 35 mm, film noir
Modello: imagen-3.0-generate-002
Oggetti
Caso d'uso | Tipo di obiettivo | Lunghezza focale | Ulteriori dettagli |
---|---|---|---|
Cibo, insetti, piante (oggetti, nature morte) | Macro | 60-105mm | Alto livello di dettaglio, messa a fuoco precisa, illuminazione controllata |
Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini di oggetti.
![]() |
![]() |
![]() |
![]() |
Prompt: foglia di una pianta di preghiera, obiettivo macro, 60 mm
Modello: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Prompt: un piatto di pasta, obiettivo macro da 100 mm
Modello: imagen-3.0-generate-002
Movimento
Caso d'uso | Tipo di obiettivo | Lunghezza focale | Ulteriori dettagli |
---|---|---|---|
Sport, fauna selvatica (in movimento) | Zoom teleobiettivo | 100-400mm | Tempo di esposizione rapido, monitoraggio di azioni o movimenti |
Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini in movimento.
![]() |
![]() |
![]() |
![]() |
Prompt: un touchdown vincente, tempo di esposizione rapido, monitoraggio dei movimenti
Modello: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Prompt: Un cervo che corre nella foresta, tempo di esposizione rapido, monitoraggio dei movimenti
Modello: imagen-3.0-generate-002
Grandangolare
Caso d'uso | Tipo di obiettivo | Lunghezza focale | Ulteriori dettagli |
---|---|---|---|
Astronomico, orizzontale (grandangolare) | Grandangolare | 10-24mm | Tempi di esposizione lunghi, messa a fuoco nitida, esposizione lunga, acqua o nuvole lisce |
Utilizzando diverse parole chiave della tabella, Imagen può generare le seguenti immagini grandangolari.
![]() |
![]() |
![]() |
![]() |
Prompt: una vasta catena montuosa, grandangolo orizzontale 10 mm
Modello: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
Prompt: una foto della luna, astrofotografia, grandangolo 10 mm
Modello: imagen-3.0-generate-002