Generar imágenes

La API de Gemini admite la generación de imágenes con Gemini 2.0 Flash Experimental y con Imagen 3. Esta guía te ayuda a comenzar a usar ambos modelos.

Para obtener orientación sobre las instrucciones de imágenes, consulta la sección Guía de instrucciones de Imagen.

Antes de comenzar

Antes de llamar a la API de Gemini, asegúrate de tener instalado el SDK que elijas y de que una clave de API de Gemini esté configurada y lista para usar.

Genera imágenes con Gemini

Gemini 2.0 Flash Experimental admite la capacidad de generar texto y líneas de imágenes. Esto te permite usar Gemini para editar imágenes de forma conversacional o generar resultados con texto entretejido (por ejemplo, generar una entrada de blog con texto e imágenes en una sola vuelta). Todas las imágenes generadas incluyen una marca de agua de SynthID, y las imágenes de Google AI Studio también incluyen una marca de agua visible.

En el siguiente ejemplo, se muestra cómo usar Gemini 2.0 para generar resultados de texto y de imagen:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();
curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png
Imagen generada por IA de un cerdo volador fantástico
Imagen generada por IA de un cerdo volador fantástico

Según la instrucción y el contexto, Gemini generará contenido en diferentes modos (texto a imagen, texto a imagen y texto, etcétera). Estos son algunos ejemplos:

  • Texto a imagen
    • Ejemplo de instrucción: “Genera una imagen de la Torre Eiffel con fuegos artificiales en el fondo”.
  • Texto a imágenes y texto (intercalado)
    • Ejemplo de instrucción: "Genera una receta ilustrada de una paella".
  • De imágenes y texto a imágenes y texto (intercaladas)
    • Ejemplo de instrucción: (Con una imagen de una habitación amueblada) “¿Qué otros colores de sofás funcionarían en mi espacio? ¿Puedes actualizar la imagen?”
  • Edición de imágenes (texto e imagen a imagen)
    • Ejemplo de instrucción: “Edita esta imagen para que parezca un dibujo animado”.
    • Ejemplo de instrucción: [imagen de un gato] + [imagen de una almohada] + “Crea un bordado de mi gato en esta almohada”.
  • Edición de imágenes de varios turnos (chat)
    • Ejemplos de instrucciones: [Sube una imagen de un auto azul.] "Convierte este auto en un convertible". “Ahora cambia el color a amarillo”.

Edición de imágenes con Gemini

Para editar una imagen, agrega una como entrada. En el siguiente ejemplo, se muestra cómo subir imágenes codificadas en base64. Para varias imágenes y cargas útiles más grandes, consulta la sección entrada de imagen.

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();
IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Limitaciones

  • Para obtener el mejor rendimiento, usa los siguientes idiomas: EN, es-MX, ja-JP, zh-CN, hi-IN.
  • La generación de imágenes no admite entradas de audio ni video.
  • Es posible que la generación de imágenes no siempre active lo siguiente:
    • El modelo solo puede generar texto. Intenta solicitar resultados de imagen de forma explícita (p.ej., “genera una imagen”, “proporciona imágenes a medida que avanzas”, “actualiza la imagen”).
    • Es posible que el modelo deje de generar contenido a mitad del proceso. Vuelve a intentarlo o prueba con otra instrucción.
  • Cuando generas texto para una imagen, Gemini funciona mejor si primero generas el texto y, luego, le pides una imagen con el texto.

Elige un modelo

¿Qué modelo deberías usar para generar imágenes? Depende de tu caso de uso.

Gemini 2.0 es mejor para producir imágenes contextualmente relevantes, combinar texto y imágenes, incorporar el conocimiento del mundo y razonar sobre las imágenes. Puedes usarlo para crear imágenes precisas y contextualmente relevantes incorporadas en secuencias de texto largas. También puedes editar imágenes de forma conversacional, con lenguaje natural, y mantener el contexto durante la conversación.

Si la calidad de la imagen es tu prioridad, Imagen 3 es una mejor opción. La imagen 3 se destaca por su fotorrealismo, sus detalles artísticos y sus estilos artísticos específicos, como el impresionismo o el anime. Imagen 3 también es una buena opción para tareas especializadas de edición de imágenes, como actualizar los fondos de los productos, mejorar las imágenes y transmitir el desarrollo de la marca y el estilo en las imágenes. Puedes usar Imagen 3 para crear logotipos o cualquier otro diseño de producto de marca.

Genera imágenes con Imagen 3

La API de Gemini proporciona acceso a Imagen 3, el modelo de texto a imagen de mayor calidad de Google, que incluye varias funciones nuevas y mejoradas. Imagen 3 puede hacer lo siguiente:

  • Genera imágenes con mejores detalles, iluminación más rica y menos artefactos que distraen que los modelos anteriores.
  • Comprender instrucciones escritas en lenguaje natural
  • Genera imágenes en una amplia variedad de formatos y estilos
  • Renderiza el texto de forma más eficaz que los modelos anteriores.
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();
curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Imagen generada por IA de dos conejos peludos en la cocina
Imagen generada por IA de dos conejos peludos en la cocina

Por el momento, Imagen solo admite instrucciones en inglés y los siguientes parámetros:

Parámetros del modelo de Imagen

(Las convenciones de nombres varían según el lenguaje de programación).

  • numberOfImages: Es la cantidad de imágenes que se generarán, de 1 a 4 (inclusive). El valor predeterminado es 4.
  • aspectRatio: Cambia la relación de aspecto de la imagen generada. Los valores admitidos son "1:1", "3:4", "4:3", "9:16" y "16:9". El valor predeterminado es "1:1".
  • personGeneration: Permite que el modelo genere imágenes de personas. Se admiten los siguientes valores:
    • "DONT_ALLOW": Bloquea la generación de imágenes de personas.
    • "ALLOW_ADULT": Genera imágenes de adultos, pero no de niños. Es el valor predeterminado.

Guía de instrucciones para Imagen

En esta sección de la guía de Imagen, se muestra cómo la modificación de una instrucción de texto a imagen puede producir diferentes resultados, junto con ejemplos de imágenes que puedes crear.

Conceptos básicos de la escritura de instrucciones

Una buena instrucción es descriptiva y clara, y usa modificadores y palabras clave significativos. Comienza por pensar en el tema, el contexto y el estilo.

Escribe el asunto, el contexto y el estilo
Texto de la imagen: Un boceto (estilo) de un edificio moderno (asunto) rodeado de rascacielos (contexto y fondo).
  1. Asunto: Lo primero que debes pensar en cualquier mensaje es el asunto: el objeto, la persona, el animal o el paisaje del que deseas una imagen.

  2. Contexto y fondo: igual de importante es el segundo plano o el contexto en el que se colocará el asunto. Intenta ubicar al asunto en diferentes fondos. Por ejemplo, un estudio con un fondo blanco, exterior o entornos interiores.

  3. Estilo: Por último, agrega el estilo de imagen que desees. Los estilos pueden ser generales (pintura, fotografías, esbozos) o muy específicos (pintura al pastel, carbón, 3D isométrico). También puedes combinar estilos.

Después de escribir una primera versión de la consigna, agrega más detalles para definirla mejor hasta que obtengas la imagen que deseas. La iteración es importante. Comienza por establecer tu idea principal y, luego, define mejor esa idea y expándela hasta que la imagen generada esté cerca de tu visión.

imagen de ejemplo fotorrealista 1
Consigna: Un parque en la primavera junto a un lago
imagen de ejemplo fotorrealista 2
Mensaje: Un parque en primavera junto a un lago, el sol se pone sobre el lago, hora dorada
imagen de ejemplo fotorrealista 3
Mensaje: Un parque en primavera junto a un lago, el sol se pone sobre el lago, hora dorada, flores silvestres rojas

Imagen 3 puede transformar tus ideas en imágenes detalladas, ya sean breves o largas y detalladas. Define mejor tu visión con instrucciones iterativas y agrega detalles hasta lograr el resultado perfecto.

Las instrucciones breves te permiten generar una imagen rápidamente.

Ejemplo de instrucción breve de Imagen 3
Mensaje: foto en primer plano de una mujer de unos 20 años, fotografía callejera, fotograma de película, tonos cálidos anaranjados apagados

Las instrucciones más largas te permiten agregar detalles específicos y crear tu imagen.

Ejemplo de instrucción larga de Imagen 3
Mensaje: foto cautivadora de una mujer de unos 20 años con un estilo de fotografía callejera. La imagen debería tener el aspecto de un fotograma de película con tonos cálidos anaranjados apagados.

Sugerencias adicionales para escribir instrucciones de Imagen:

  • Usa un lenguaje descriptivo: Emplea adjetivos y adverbios detallados para dibujar una imagen clara de la Imagen 3.
  • Proporciona contexto: Si es necesario, incluye información contextual para ayudar a la IA a comprender el contenido.
  • Consulta artistas o estilos específicos: Si tienes una estética en particular en mente, puede ser útil consultar artistas o movimientos artísticos específicos.
  • Usa herramientas de ingeniería de instrucciones: Considera explorar herramientas o recursos de ingeniería de instrucciones para ayudarte a definir mejor tus instrucciones y lograr resultados óptimos.
  • Cómo mejorar los detalles faciales en tus imágenes personales y grupales:
    • Especifica los detalles faciales como un enfoque de la foto (por ejemplo, usa la palabra “retrato” en la instrucción).

Genera texto en imágenes

Imagen puede agregar texto a las imágenes, lo que abre más posibilidades de generación de imágenes creativas. Sigue las instrucciones que se indican a continuación para aprovechar al máximo esta función:

  • Itera con confianza: Es posible que debas volver a generar imágenes hasta lograr el aspecto que deseas. La integración de texto de Imagen aún está evoluconando y, a veces, varios intentos proporcionan los mejores resultados.
  • Breve: Limita el texto a 25 caracteres o menos para obtener una generación óptima.
  • Varias frases: Experimenta con dos o tres frases distintas para proporcionar información adicional. Evita exceder las tres frases para obtener composiciones más claras.

    Ejemplo de generación de texto de Imagen 3
    Consigna: Un póster con el texto “Summerland” en negrita como título, debajo de este texto está el eslogan “Summer never felt so good”
  • Posición de guía: Si bien Imagen puede intentar posicionar el texto según las instrucciones, es posible que haya variaciones ocasionales. Esta función se mejora continuamente.

  • Inspirar estilo de fuente: Especifica un estilo de fuente general para influir sutilmente en las elecciones de Imagen. No confíes en la replicación precisa de fuentes, pero espera interpretaciones creativas.

  • Tamaño de fuente: Especifica un tamaño de fuente o una indicación general de tamaño (por ejemplo, pequeño, mediano, grande) para influir en la generación del tamaño de fuente.

Parametrización de instrucciones

Para controlar mejor los resultados de la salida, te puede resultar útil parametrizar las entradas en Imagen. Por ejemplo, supongamos que quieres que tus clientes puedan generar logotipos para sus empresas y quieres asegurarte de que los logotipos siempre se generen en un fondo de color sólido. También debes limitar las opciones que el cliente puede seleccionar de un menú.

En este ejemplo, puedes crear una instrucción parametrizada similar a la siguiente:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

En tu interfaz de usuario personalizada, el cliente puede ingresar los parámetros con un menú, y el valor que elija propagará la instrucción que recibe Imagen.

Por ejemplo:

  1. Instrucción: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Ejemplo 1 de parametrización de la instrucción de la imagen 3

  2. Instrucción: A modern logo for a software company on a solid color background. Include the text Silo.

    Ejemplo 2 de parametrización de la instrucción de Imagen 3

  3. Instrucción: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Ejemplo 3 de parametrización de la instrucción de la imagen 3

Técnicas avanzadas de escritura de mensajes

Usa los siguientes ejemplos para crear mensajes más específicos basados en atributos como descriptores de fotografía, formas y materiales, movimientos históricos de arte y modificadores de calidad de imagen.

Fotografía

  • El mensaje contiene: "Una foto de…"

Para usar este estilo, comienza por usar palabras clave que indiquen con claridad a Imagen que buscas una fotografía. Comienza el mensaje con “Una foto de. . ". Por ejemplo:

imagen de ejemplo fotorrealista 1
Mensaje: Una foto de
granos de café en una cocina en una superficie de madera
imagen de ejemplo fotorrealista 2
Mensaje: Una foto de
una barra de chocolate en un mostrador de cocina
imagen de ejemplo fotorrealista 3
Mensaje: Una foto de
un edificio moderno con agua en el fondo

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 3.

Modificadores de fotografía

En los siguientes ejemplos, puedes ver varios modificadores y parámetros específicos de la fotografía. Puedes combinar varios modificadores para obtener un control más preciso.

  1. Proximidad de la cámara: Acercamiento, tomado desde lejos

    Imagen de muestra de la cámara
    Mensaje: Una foto en primer plano de granos de café
    imagen de ejemplo de cámara alejada
    Mensaje: Una foto alejada de una bolsa pequeña de
    granos de café en una cocina desordenada

  2. Posición de la cámara: aérea, desde abajo

    imagen de muestra de foto aérea
    Mensaje: Foto aérea de la ciudad urbana con rascacielos
    vista desde debajo de la imagen de ejemplo
    Mensaje: Una foto de un dosel arbóreo con cielo azul desde abajo
  3. Iluminación: natural, drástica, cálida, fría

    imagen de ejemplo de iluminación natural
    Mensaje: Foto de estudio de un sillón moderno, iluminación natural
    Imagen de ejemplo de iluminación drástica
    Mensaje: Foto de estudio de un sillón moderno, iluminación dramática
  4. Configuración de la cámara - desenfoque de movimiento, enfoque suave, bokeh, vertical

    Imagen de ejemplo de desenfoque de movimiento
    Mensaje: foto de una ciudad con rascacielos desde el interior de un automóvil con desenfoque de movimiento
    Imagen de ejemplo de enfoque suave
    Mensaje: Foto con enfoque suave de un puente en una ciudad urbana por la noche
  5. Tipos de lentes: 35 mm, 50 mm, ojo de pez, gran angular, macro

    imagen de ejemplo de Lentes macro
    Mensaje: foto de una hoja, lente macro
    Imagen de ejemplo de lente ojo de pez
    Mensaje: fotografía callejera, ciudad de Nueva York, lente ojo de pez
  6. Tipos de película: blanco y negro, polaroid

    Imagen de ejemplo de foto polaroid
    Mensaje: un retrato polaroid de un perro con anteojos de sol
    imagen de ejemplo en blanco y negro
    Mensaje: Foto en blanco y negro de un perro con anteojos de sol

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 3.

Ilustración y arte

  • El mensaje incluye: “Un painting de…” “Un sketch de…”

Los estilos de arte varían desde estilos monocromáticos como esbozos de lápiz hasta arte digital hiperrealista. Por ejemplo, las siguientes imágenes usan el mismo mensaje con diferentes estilos:

“Un [art style or creation technique] de un sedán eléctrico deportivo angular con rascacielos en el fondo”

imágenes de muestra de arte
Mensaje: Un dibujo técnico en lápiz de un… angular
imágenes de muestra de arte
Mensaje: Un dibujo en carbón de un… angular
imágenes de muestra de arte
Mensaje: Un dibujo en lápiz de color de un… angular
imágenes de muestra de arte
Mensaje: Una pintura al pastel de un… angular
imágenes de muestra de arte
Mensaje: Arte digital de un… angular
imágenes de muestra de arte
Mensaje: Un art decó (un póster) de un… angular

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 2.

Formas y materiales

  • El mensaje incluye: “…hecho de…”, “…en forma de…”

Una de las fortalezas de esta tecnología es que puedes crear imágenes que, de otro modo, serían difíciles o imposibles. Por ejemplo, puedes recrear el logotipo de tu empresa en diferentes materiales y texturas.

imagen de ejemplo de formas y materiales 1
Mensaje: Un bolso de lona hecho de queso
imagen de ejemplo de formas y materiales 2
Mensaje: tubos de neón en forma de un ave
imagen de ejemplo de formas y materiales 3
Mensaje: un sillón de papel, foto de estudio, estilo origami

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 3.

Referencias al arte histórico

  • El mensaje incluye: "…en el estilo de…"

Algunos estilos se han convertido en íconos con el tiempo. A continuación, se presentan algunas ideas de estilos históricos de pintura o arte que puedes probar.

“genera una imagen al estilo de [art period or movement] : una granja eólica”

imagen de ejemplo del impresionismo
Mensaje: Genera una imagen al estilo de una pintura impresionista: una granja eólica
imagen de ejemplo del renacimiento
Mensaje: Genera una imagen al estilo de una pintura renacentista: una granja eólica
imagen de ejemplo de arte pop
Mensaje: Genera una imagen al estilo del arte pop: una granja eólica

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 3.

Modificadores de calidad de la imagen

Ciertas palabras clave pueden informarle al modelo que buscas un recurso de alta calidad. Algunos ejemplos de modificadores de calidad son los siguientes:

  • Modificadores generales: Alta calidad, hermosa, estilizado
  • Fotos: 4K, HDR, foto de estudio
  • Ilustración y arte: de un profesional, detallada

A continuación, se muestran algunos ejemplos de mensajes sin modificadores de calidad y el mismo mensaje con modificadores de calidad.

imagen de ejemplo de un maíz sin modificadores
Mensaje (sin modificadores de calidad): una foto de un tallo de maíz
imagen de ejemplo de maíz con modificadoresMensaje (con modificadores de calidad): 4K HDR hermosa
foto de un tallo de maíz tomada por un fotógrafo profesional

Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo de Imagen 3.

Relaciones de aspecto

La generación de imágenes de Imagen 3 te permite establecer cinco relaciones de aspecto de imagen distintas.

  1. Cuadrada (1:1, predeterminada): es una foto cuadrada estándar. Los usos comunes de esta relación de aspecto incluyen las publicaciones en redes sociales.
  2. Pantalla completa (4:3): esta relación de aspecto se suele usar en el contenido multimedia o las películas. También tienen las dimensiones de la mayoría de las TVs antiguas (no de pantalla ancha) y las cámaras de formato medio. Captura una mayor parte de la escena horizontal (en comparación con una imagen 1:1), por lo que se trata de una relación de aspecto preferida para la fotografía.

    ejemplo de relación de aspecto
    Mensaje: primer plano de los dedos de un músico tocando el piano, una película en blanco y negro, vintage (relación de aspecto de 4:3)
    ejemplo de relación de aspecto
    Mensaje: una foto de estudio profesional de papas fritas para un restaurante refinado, al estilo de una revista gastronómica (relación de aspecto de 4:3)
  3. Pantalla completa vertical (3:4): esta es la relación de aspecto de la pantalla completa rotada 90 grados. Esto permite capturar más imágenes de la escena de manera vertical en comparación con la relación de aspecto de 1:1.

    ejemplo de relación de aspecto
    Mensaje: una mujer haciendo senderismo, cerca de sus botas reflejadas en un charco, grandes montañas en el fondo, al estilo de un anuncio, ángulos drásticos (relación de aspecto de 3:4)
    ejemplo de relación de aspecto
    Mensaje: toma aérea de un río que fluye por un valle místico (relación de aspecto de 3:4)
  4. Pantalla ancha (16:9): esta proporción reemplazó a 4:3 y ahora es la relación de aspecto más común para TVs, monitores y pantallas de teléfonos celulares (horizontal). Usa esta relación de aspecto cuando quieras capturar más del fondo (por ejemplo, paisajes panorámicos).

    ejemplo de relación de aspecto
    Mensaje: un hombre con ropa blanca sentado en la playa, en primer plano, con la iluminación de la hora dorada (relación de aspecto de 16:9)
  5. Vertical (9:16): esta proporción es para la pantalla ancha, pero rotada. Esta es una relación de aspecto relativamente nueva que se popularizó en las apps de video de formato corto (por ejemplo, YouTube Shorts). Úsala para objetos altos con orientaciones verticales sólidas, como edificios, árboles, cascadas y otros objetos similares.

    ejemplo de relación de aspecto
    Mensaje: una renderización digital de un rascacielos enorme, moderno, grande, épico con una hermosa puesta de sol en el fondo (relación de aspecto de 9:16)

Imágenes fotorrealistas

Diferentes versiones del modelo de generación de imágenes pueden ofrecer una combinación de resultados artísticos y fotorrealistas. Usa las siguientes palabras en los mensajes para generar un resultado más fotorrealista, según el asunto que quieras generar.

Caso de uso Tipo de lente Longitudes focales Detalles adicionales
Personas (retratos) Prime, zoom De 24 a 35 mm película en blanco y negro, película noir, profundidad de campo, doble tono (mencionar dos colores)
Alimentos, insectos, plantas (objetos, naturaleza muerta) Macro De 60 a105 mm Iluminación controlada, enfoque preciso y de gran detalle
Deportes y fauna (movimiento) Acercar el teleobjetivo De 100 a 400 mm Velocidad rápida del obturador, acción o seguimiento de movimiento
Astrómico, horizontal (gran angular) Gran angular De 10 a 24 mm Tiempos de exposición largos, enfoque nítido, exposición larga, agua o nubes fluidas

Retrato

Caso de uso Tipo de lente Longitudes focales Detalles adicionales
Personas (retratos) Prime, zoom De 24 a 35 mm película en blanco y negro, película noir, profundidad de campo, doble tono (mencionar dos colores)

Con varias palabras clave de la tabla, Imagen puede generar los siguientes retratos:

ejemplo de retrato ejemplo de retrato ejemplo de retrato ejemplo de retrato

Mensaje: Una mujer (retratos de 35 mm, tonos duales azules y grises)
Modelo: imagen-3.0-generate-002

ejemplo de retrato ejemplo de retrato ejemplo de retrato ejemplo de retrato

Mensaje: Una mujer, retrato de 35 mm, modelo de cine
Modelo: imagen-3.0-generate-002

Objetos

Caso de uso Tipo de lente Longitudes focales Detalles adicionales
Alimentos, insectos, plantas (objetos, naturaleza muerta) Macro De 60 a105 mm Iluminación controlada, enfoque preciso y de gran detalle

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes de objetos:

ejemplo de fotografía de objetos ejemplo de fotografía de objetos ejemplo de fotografía de objetos ejemplo de fotografía de objetos

Mensaje: hoja de una planta de oración, lente macro, 60 mm
Modelo: imagen-3.0-generate-002

ejemplo de fotografía de objetos ejemplo de fotografía de objetos ejemplo de fotografía de objetos ejemplo de fotografía de objetos

Mensaje: un plato de pasta, 100 mm con lente macro
Modelo: imagen-3.0-generate-002

Movimiento

Caso de uso Tipo de lente Longitudes focales Detalles adicionales
Deportes y fauna (movimiento) Acercar el teleobjetivo De 100 a 400 mm Velocidad rápida del obturador, acción o seguimiento de movimiento

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes en movimiento:

ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento

Mensaje: una anotación ganadora, velocidad de obturador rápida y seguimiento del movimiento
Modelo: imagen-3.0-generate-002

ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento ejemplo de fotografía en movimiento

Mensaje: Un ciervo corriendo en el bosque, velocidad rápida del obturador, seguimiento de movimiento
Modelo: imagen-3.0-generate-002

Gran angular

Caso de uso Tipo de lente Longitudes focales Detalles adicionales
Astrómico, horizontal (gran angular) Gran angular De 10 a 24 mm Tiempos de exposición largos, enfoque nítido, exposición larga, agua o nubes fluidas

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes con gran angular:

ejemplo de fotografía gran angular ejemplo de fotografía gran angular ejemplo de fotografía gran angular ejemplo de fotografía gran angular

Mensaje: una cordillera extensa, gran angular horizontal de 10 mm
Modelo: imagen-3.0-generate-002

ejemplo de fotografía gran angular ejemplo de fotografía gran angular ejemplo de fotografía gran angular ejemplo de fotografía gran angular

Mensaje: una foto de la luna, fotografías astrológicas, ángulo amplio de 10 mm
Modelo: imagen-3.0-generate-002

¿Qué sigue?