如要使用 Imagen,您必須提供要產生內容的文字說明。這些說明稱為「提示」,也是您與 Imagen 互動的主要方式。
本指南將說明如何修改文字轉圖片提示的部分內容,產生不同的結果,並提供可建立的圖片範例。
提示撰寫基本概念 (主題、脈絡和風格)
雖然撰寫良好提示的方法有很多種,但加入一些關鍵字和修飾符,有助於您更接近最終目標。提示不需要很長或複雜,但大多數良好的提示都具有描述性且清楚明瞭。
建議您從思考主題、情境和風格開始。
![強調主題、脈絡和風格的提示](https://ai.google.dev/static/gemini-api/docs/images/imagen/style-subject-context.png?hl=zh-tw)
主題:無論提示是什麼,首先要考慮的都是主題:也就是你想拍攝的物件、人物、動物或風景。
背景和背景資訊:主體的背景或脈絡也很重要。嘗試將主體放在各種背景中。例如使用白色背景的攝影棚、戶外或室內環境。
樣式:最後,請新增所需的圖片樣式。風格可以是一般風格 (繪畫、相片、素描),也可以是特定風格 (粉彩繪畫、炭筆繪畫、等角線 3D)。您也可以結合樣式。
完成第一個版本的提示後,請加入更多細節來精進提示,直到產生您想要的圖片為止。迭代相當重要。請先建立核心構想,然後再對該構想進行精進和擴充,直到產生的圖像符合您的構想為止。
![]() |
![]() |
![]() |
Imagen 3 提示撰寫
無論提示內容是簡短還是冗長,Imagen 3 都能將您的想法轉換為詳細圖像。透過不斷提示來調整您的願景,並加入更多細節,直到達到完美結果為止。
您可以透過簡短的提示快速生成圖片。 ![]() |
較長的提示可讓您加入特定詳細資料並建立圖片。 ![]() |
針對 Imagen 3 提示的其他撰寫建議:
- 使用描述性語言:使用詳細的形容詞和副詞,為圖 3 描繪清晰的圖像。
- 提供背景資訊:視需要加入背景資訊,協助 AI 瞭解內容。
- 參考特定藝術家或風格:如果你有特定美學概念,參考特定藝術家或藝術運動可能會很有幫助。
- 使用提示工程工具:建議您探索提示工程工具或資源,協助您修正提示並取得最佳結果。
- 修飾個人和團體相片中的臉部細節:
- 指定臉部細節做為相片的重點 (例如在提示中使用「肖像」一詞)。
在圖片中產生文字
Imagen 3 可在圖片中加入文字,為您帶來更多創意圖像生成的可能性。請參考下列指南,充分運用這項功能:
- 自信地進行疊代:您可能需要重新產生圖片,直到達到所需外觀為止。Imagen 的文字整合功能仍在不斷改進,有時需要多次嘗試才能獲得最佳結果。
- 精簡文字:為確保最佳產生結果,請將文字長度控制在 25 個半形字元以內。
多個詞組:嘗試使用兩或三個不同的詞組,提供額外資訊。為避免組合過於複雜,請避免使用超過三個字詞。
提示:海報上以粗體字顯示「Summerland」做為標題,下方則有「Summer never felt so good」的標語 指引文字位置:雖然 Imagen 會嘗試依指示放置文字,但偶爾可能會出現變化。這項功能會持續改善。
Inspire 字型樣式:指定一般字型樣式,以微妙的方式影響 Imagen 的選擇。請勿依賴精確的字型複製,而是期待創意詮釋。
字型大小:指定字型大小或一般大小指標 (例如「小」、「中」、「大」),以影響字型大小產生方式。
提示參數化
為進一步控制輸出結果,您可能會發現將輸入內容轉換為 Imagen 的參數很有幫助。舉例來說,假設您希望客戶能夠為自家業務產生標誌,並確保標誌一律會在純色背景上產生。您也想限制用戶可從選單中選取的選項。
在這個範例中,您可以建立類似下列的參數化提示:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
在自訂使用者介面中,客戶可以使用選單輸入參數,而他們選擇的值會填入 Imagen 收到的提示。
例如:
提示:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
提示:
A modern logo for a software company on a solid color background. Include the text Silo.
提示:
A traditional logo for a baking company on a solid color background. Include the text Seed.
風格:攝影
- 提示包含:「相片中有...」
如要使用這類樣式,請先使用關鍵字,清楚告知 Imagen 你要尋找的是一張相片。按照以下格式輸入提示:"A photo of. 。。例如:
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用對應的文字提示,搭配 Imagen 3 模型生成。
風格:插圖和藝術
- 提示包括:「painting of...」「A sketch of...」
藝術風格多元,從素描等單色風格到超寫實的數位藝術都有。例如,下列圖片使用相同提示,但風格不同:
「An [art style or creation technique] of an angular sporty electric sedan with skyscrapers in the background」
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用相應的文字提示,搭配 Imagen 2 模型生成。
進階提示撰寫技巧
請參考下列範例,根據以下屬性建立更具體的提示:攝影描述詞、形狀和材質、歷史藝術運動和圖片品質修飾符。
攝影輔助工具
在以下範例中,您可以看到幾個攝影專用修飾符和參數。您可以結合多個修飾符,以便更精確地控制。
相機距離 - 特寫,從遠處拍攝
提示:咖啡豆的特寫相片 提示:廚房凌亂,一小包
咖啡豆的縮小相片相機位置:從下方拍攝的空拍畫面
提示:有摩天大樓的城市空拍照 提示:一張森林樹冠的照片,從下方拍攝 燈光:自然、戲劇性、溫暖、冷色
提示:現代扶手椅的攝影棚相片,使用自然光 拍攝提示:現代扶手椅的攝影棚相片,燈光效果強烈 相機設定 - 動態模糊、柔焦、散景、肖像
提示:在車內拍攝摩天大樓的城市相片,並加上動態模糊 效果提示:拍攝城市夜晚橋樑的柔焦相片 鏡頭類型:35 公釐、50 公釐、魚眼、廣角、微距
提示:葉子相片,微距鏡頭 提示:街頭攝影、紐約市、魚眼鏡頭 底片類型:黑白、拍立得
提示:Polaroid 肖像相片,顯示戴著太陽眼鏡的狗狗 提示:黑白相片,顯示戴著太陽眼鏡的狗狗
圖片來源:每張圖片都是使用相應的文字提示,搭配 Imagen 3 模型產生。
形狀和材質
- 提示包含:"...made of..."「...in the shape of...」
這項技術的優點之一,就是可以創造出原本難以或無法創造的圖像。舉例來說,您可以使用不同的材質和紋理重現公司標誌。
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用相應的文字提示,搭配 Imagen 3 模型生成。
歷史藝術參考資料
- 提示包含:「...in the style of...」
某些風格經過多年發展,已成為經典。以下是一些歷史上繪畫或藝術風格的想法,供您參考。
「產生 [art period or movement] 風力發電廠的圖片」
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用相應的文字提示,搭配 Imagen 3 模型生成。
圖片品質修飾符
特定關鍵字可讓模型知道你正在尋找高品質素材資源。品質修飾字詞的例子包括:
- 一般修飾符:高品質、美觀、風格化
- 相片:4K、HDR、攝影棚相片
- 藝術、插圖 - 由專業人士提供詳細資料
以下列舉幾個不含品質修飾符的提示,以及含有品質修飾符的相同提示。
![]() |
![]() 玉米莖的相片,由 專業攝影師拍攝 |
圖片來源:每張圖片都是使用相應的文字提示,搭配 Imagen 3 模型生成。
顯示比例
使用 Imagen 3 圖片產生功能,您可以設定五種不同的圖片顯示比例。
- 正方形 (1:1,預設值):標準正方形相片。這個顯示比例的常見用途包括社群媒體貼文。
全螢幕 (4:3):此顯示比例通常用於媒體或電影。這也是大多數舊型 (非寬螢幕) 電視和中型相機的尺寸。相較於 1:1,這類相片可在水平方向捕捉更多場景,因此是攝影的理想長寬比。
提示:特寫音樂家彈鋼琴的手指,黑白電影,復古風格 (4:3 顯示比例) 提示:高級餐廳的薯條專業攝影棚相片,以美食雜誌風格呈現 (4:3 顯示比例) 直向全螢幕 (3:4):這是旋轉 90 度的全螢幕顯示比例。相較於 1:1 的顯示比例,這可讓您在垂直方向上捕捉更多場景。
提示:一位女性在健行,她的靴子在水坑中反射,背景是高山,以廣告風格呈現,角度誇張 (3:4 的顯示比例) 提示:空拍畫面,拍攝河流流經神秘山谷 (3:4 長寬比) 寬螢幕 (16:9):這個比例取代了 4:3,目前是電視、螢幕和手機螢幕 (橫向) 最常見的顯示比例。如要拍攝更多背景 (例如風景),請使用這個顯示比例。
提示:一名穿著全白衣服的男子坐在沙灘上,特寫鏡頭,黃金時段燈光 (16:9 顯示比例) 直向 (9:16):這個比例是旋轉過的寬螢幕。這是相對較新的顯示比例,已在短篇影片應用程式 (例如 YouTube Shorts) 中廣為流行。請針對具有明顯垂直方向的物件使用此選項,例如建築物、樹木、瀑布或其他類似物件。
提示:數位轉譯的大型摩天大樓,現代、宏偉、壯觀,背景為美麗的夕陽 (9:16 顯示比例)
逼真的圖像
不同版本的圖片產生模型可能會提供藝術和逼真的輸出內容。在提示中使用以下文字,根據您要產生的主題,產生更逼真的輸出內容。
用途 | 鏡頭類型 | 焦距 | 其他詳細資訊 |
---|---|---|---|
人物 (人像) | 角分符號、縮放 | 24-35mm | 黑白電影、黑色電影、景深、雙色 (提及兩種顏色) |
食物、昆蟲、植物 (物件、靜物) | 巨集 | 60-105 公釐 | 高解析度、精確對焦、控光 |
運動、野生動物 (動作) | 望遠變焦 | 100-400 毫米 | 快門速度快、追蹤動作或移動 |
天文、橫向 (廣角) | 廣角 | 10-24mm | 長時間曝光、清晰對焦、長時間曝光、平滑的水面或雲朵 |
人像
用途 | 鏡頭類型 | 焦距 | 其他詳細資訊 |
---|---|---|---|
人物 (人像) | 角分符號、縮放 | 24-35mm | 黑白電影、黑色電影、景深、雙色 (提及兩種顏色) |
使用表格中的幾個關鍵字,Imagen 可以產生下列肖像。
![]() |
![]() |
![]() |
![]() |
提示:女性,35 毫米肖像,藍色和灰色雙色調
模型:imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
提示:一位女性,35 公釐相片,黑色電影
模型:imagen-3.0-generate-002
物件
用途 | 鏡頭類型 | 焦距 | 其他詳細資訊 |
---|---|---|---|
食物、昆蟲、植物 (物件、靜物) | 巨集 | 60-105 公釐 | 高解析度、精確對焦、控光 |
使用表格中的幾個關鍵字,Imagen 可以產生下列物件圖片。
![]() |
![]() |
![]() |
![]() |
提示:禱告竹葉、微距鏡頭、60mm
模型:imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
提示:一盤義大利麵,100 公釐微距鏡頭
型號:imagen-3.0-generate-002
動作
用途 | 鏡頭類型 | 焦距 | 其他詳細資訊 |
---|---|---|---|
運動、野生動物 (動作) | 望遠變焦 | 100-400 毫米 | 快門速度快、追蹤動作或移動 |
使用表格中的幾個關鍵字,Imagen 可以產生下列動態圖片。
![]() |
![]() |
![]() |
![]() |
提示:勝利達陣、快門速度快、追蹤動作
模型:imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
提示:在森林中奔跑的鹿、快門速度快、追蹤動作
模型:imagen-3.0-generate-002
廣角
用途 | 鏡頭類型 | 焦距 | 其他詳細資訊 |
---|---|---|---|
天文、橫向 (廣角) | 廣角 | 10-24mm | 長時間曝光、清晰對焦、長時間曝光、平滑的水面或雲朵 |
使用表格中的幾個關鍵字,Imagen 可以產生下列廣角圖片。
![]() |
![]() |
![]() |
![]() |
提示:廣闊的山脈,風景廣角 10mm
模型:imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
提示:月亮相片、天文攝影、廣角 10mm
模型:imagen-3.0-generate-002