El rápido manual de ingeniería para Nano Banana Pro
Estructura, iluminación, composición y lenguaje de la cámara que realmente mueven la aguja cuando solicitan a Nano Banana Pro un trabajo comercial.
Sarah Thompson
·4 min read

El primer mensaje comercial que escribí para Nano Banana Pro fue este: "un hermoso frasco de perfume sobre una superficie de mármol, alta calidad, 8k, profesional".
Lo que obtuve fue un desperdicio de IA. Estaba furioso: había visto el mismo mensaje producir una magnífica producción de Midjourney el mes anterior. Casi culpo al modelo. Luego leí los documentos, ejecuté cien mensajes A/B en un fin de semana y descubrí la verdadera regla.
Nano Banana Pro es el modelo más literal que he usado. Esa es una característica, no un error: hace exactamente lo que le dices. Lo que significa que la calidad de su salida es 80% formato rápido y 20% suerte. Los volcados de adjetivos no funcionan. Una gramática de cinco espacios sí lo hace.
Esta es la estructura que uso ahora para cada rodaje comercial, la misma que desearía que alguien me hubiera entregado en mi primer fin de semana.
El mensaje de cinco espacios
[Subject] [Action/Pose] [Environment] [Lighting] [Camera + Lens]Cada ranura en orden. No hay adjetivos añadidos al final.
Malo:
un hermoso frasco de perfume sobre una superficie de mármol, alta calidad, 8k, profesional
Bien:
Un frasco de perfume de vidrio transparente con una tapa en tono dorado, de pie sobre una losa de mármol blanco pulido, la suave luz de la mañana que entra por una ventana orientada al norte que proyecta una suave sombra diagonal, tomada con una Canon R5 con una lente macro de 100 mm a f/5.6
El segundo mensaje le ofrece una fotografía del producto utilizable. El primero te da una pendiente de IA.
Utilice el formato de cinco espacios en un resumen de imagen de producto real.
Genere tres versiones, luego inspeccione la forma del sujeto, la dirección de la iluminación y la textura del material antes de dedicar tiempo a editar.
Lenguaje de iluminación que funciona
- "Suave luz de la mañana desde una ventana orientada al norte" → uniforme y respetuosa con el producto
- "Luz de estudio cenital intensa con una tarjeta de rebote negra a la izquierda" → alto contraste, editorial
- "Luz lateral de hora dorada desde el marco derecho, temperatura de color cálida" → estilo de vida, exterior
- "Luz diurna nublada, difusa, sin sombras visibles" → imágenes técnicas/de especificaciones
Evite: "iluminación cinematográfica", "iluminación dramática", "iluminación perfecta". Estos adjetivos no apuntan al modelo hacia nada específico.
Idioma de la cámara que funciona
Nano Banana Pro responde al equipo de cámara real. Tres plantillas seguras:
- Producto: "Canon R5 + objetivo macro de 100 mm a f/5,6"
- Estilo de vida: "Fujifilm X-T5 + 35 mm f/1,4 a f/2,8, ISO natural"
- Editorial: "Hasselblad H6D-100C + lente 80mm a f/8, formato medio"
El modelo los utiliza como tokens de estilo. En realidad, no es necesario que tengas la cámara: le estás diciendo al modelo de qué distribución de imágenes tomar muestras.
La relación de aspecto importa más de lo que crees
Elija su proporción antes de escribir el mensaje, no después. Un cuadrado 1:1 y un paisaje 16:9 no son la misma imagen recortada: se componen de manera diferente en el espacio latente del modelo.
- 1:1: publicaciones sociales, miniaturas, imágenes de perfil
- 4:5: Feed de Instagram, Pinterest
- 9:16: historias, reels, TikTok
- 16:9: banners de héroe, miniaturas de YouTube, héroe de página de destino
- 3:2: editorial, imágenes destacadas del blog
- 2:3: impresión, póster, portada de libro
Qué dejar fuera
- "Muy detallado": redundante, añade ruido.
- "8K, 4K, HD": no afecta la calidad, solo desperdicia tokens
- "Obra maestra, premiada" — desencadena una estética genérica
- Pilas de estilo largo ("de Greg Rutkowski al estilo de..."): diluye el control
El ciclo de iteración
Presupuesto tres generaciones por imagen final:
- Primer paso: mensaje completo tal como está escrito, 1 imagen
- Refinar: ajusta la iluminación o la cámara según lo que salió mal en el primer renderizado.
- Esmalte: aprieta la composición, agrega o elimina un detalle
Si estás en GPT Image2 Studio Basic, son entre 60 y 90 créditos (aproximadamente 2 o 3 renderizaciones de Nano Banana Pro) por final. Realista.
La regla de una oración
Si su mensaje tiene más de dos oraciones, está confundiendo el modelo. Córtalo. Cada palabra debe ganarse su lugar.
El resultado final
- Utilice la gramática de cinco espacios: Asunto → Acción → Entorno → Iluminación → Cámara. Cada ranura en orden, sin adjetivos atornillados al final.
- Elimine los vertederos de adjetivos: "8k, obra maestra, muy detallada" agrega ruido, no calidad.
- La iluminación y el lenguaje de la cámara son tu verdadera palanca: nombra la ventana, nombra la lente.
- Elija la relación de aspecto antes de escribir el mensaje, no después. Diferentes proporciones son diferentes composiciones latentes, no cultivos.
- Presupuesta 3 generaciones por imagen final: repetirás. Cree una biblioteca ganadora por categoría y reutilícela agresivamente.
Pruebe la gramática de cinco espacios en su propia foto de producto: cada cuenta nueva comienza con 30 créditos y desbloquea 30 más después de la primera imagen exitosa: gptimg.app/.
Frequently asked questions
Do I need a credit card to try GPT Image2 Studio?
No. Every new account starts with 30 credits on signup, then unlocks 30 more after the first successful image. Paid plans only kick in if you want more than the free ceiling.
Can I use the generated images commercially?
Yes. Every tier, including the free starter credits, comes with full commercial rights. Run ads, sell products, print on merchandise, publish on any platform. No watermark, no attribution required.
Which model should I route to for what?
Hero ads and text-heavy creative fit GPT Image 1.5 high. Product and macro texture work fit Nano Banana Pro. High-volume social iteration fits Nano Banana 2. Fast drafts and mood boards fit Z Image. The workbench can route one prompt across all of them.
How fast is a single generation?
Z Image returns in about 10 seconds. Nano Banana 2 often returns in 15 to 20 seconds. Nano Banana Pro and GPT Image 1.5 high usually take 30 to 45 seconds for standard quality, and up to about a minute for 4K high quality.
What's the difference between GPT Image 1.5 high and Nano Banana 2?
GPT Image 1.5 high is stronger for text inside images and premium ad creative. Nano Banana 2 is faster and cheaper. In production, compare both with the same prompt before choosing the final image.
Can I edit an existing image instead of generating from scratch?
Yes. Upload a reference image, then continue with image-to-image, masked edits, background removal, object cleanup, or compression inside the same workflow.
Stop guessing the model.
Run all three.
We route your prompt to GPT Image 1.5 high, Nano Banana 2, Z Image and more — same workbench, same prompt, side-by-side blind compare. 30 credits on signup, another 30 after your first successful image, and commercial rights at every tier.
30 + 30
Free credits
5+
SOTA models
30s
To first render