Das schnelle Engineering-Playbook für Nano Banana Pro
Struktur, Beleuchtung, Komposition und Kamerasprache sind die entscheidenden Faktoren, wenn es darum geht, Nano Banana Pro für kommerzielle Arbeiten zu gewinnen.
Sarah Thompson
·4 min read

Die erste kommerzielle Aufforderung, die ich jemals für Nano Banana Pro geschrieben habe, war diese: „Eine wunderschöne Parfümflasche auf einer Marmoroberfläche, hochwertig, 8k, professionell.“
Was ich zurückbekam, war KI-Schwachsinn. Ich war wütend – ich hatte im Monat zuvor beobachtet, wie dieselbe Aufforderung einen großartigen Midjourney-Output hervorbrachte. Ich hätte fast dem Model die Schuld gegeben. Dann habe ich die Dokumente gelesen, an einem Wochenende hundert A/B-Eingabeaufforderungen durchgeführt und die eigentliche Regel herausgefunden.
Nano Banana Pro ist das wörtlichste Modell, das ich je verwendet habe. Das ist eine Funktion, kein Fehler – es macht genau das, was Sie ihm sagen. Das bedeutet, dass die Qualität Ihrer Ausgabe zu 80 % vom Schnellformat und zu 20 % vom Glück abhängt. Adjektiv-Dumps funktionieren nicht. Eine Fünf-Slot-Grammatik schon.
Hier ist die Struktur, die ich jetzt für jedes Werbeshooting verwende – dieselbe, von der ich wünschte, jemand hätte sie mir für mein erstes Wochenende gegeben.
Die Fünf-Slot-Eingabeaufforderung
[Subject] [Action/Pose] [Environment] [Lighting] [Camera + Lens]Jeder Slot in Ordnung. Am Ende werden keine Adjektive hinzugefügt.
Schlecht:
eine wunderschöne Parfümflasche auf einer Marmoroberfläche, hochwertig, 8k, professionell
Gut:
Eine Parfümflasche aus klarem Glas mit goldfarbenem Verschluss, die aufrecht auf einer polierten weißen Marmorplatte steht, sanftes Morgenlicht aus einem nach Norden gerichteten Fenster, das einen sanften diagonalen Schatten wirft, aufgenommen mit einer Canon R5 mit einem 100-mm-Makroobjektiv bei f/5,6
Mit der zweiten Eingabeaufforderung erhalten Sie eine brauchbare Produktaufnahme. Der erste bringt Ihnen KI-Slop.
Verwenden Sie das Fünf-Slot-Format für ein echtes Produktbild-Briefing.
Erstellen Sie drei Versionen und überprüfen Sie dann die Form des Motivs, die Beleuchtungsrichtung und die Materialtextur, bevor Sie mit der Bearbeitung beginnen.
Lichtsprache, die funktioniert
- „Weiches Morgenlicht aus Nordfenster“ → gleichmäßig, produktschonend
- „Hartes Overhead-Studiolicht mit schwarzer Bounce-Karte auf der linken Seite“ → kontrastreich, Leitartikel
- „Goldene Stunde Seitenlicht vom rechten Rahmen, warme Farbtemperatur“ → Lifestyle, Outdoor
- „Bewölktes Tageslicht, diffus, keine sichtbaren Schatten“ → technische/spezifizierte Bilder
Vermeiden Sie: „filmische Beleuchtung“, „dramatische Beleuchtung“, „perfekte Beleuchtung“. Diese Adjektive weisen das Modell nicht auf etwas Bestimmtes hin.
Kamerasprache, die funktioniert
Nano Banana Pro reagiert auf echte Kameraausrüstung. Drei sichere Vorlagen:
- Produkt: „Canon R5 + 100 mm Makroobjektiv bei f/5,6“
- Lifestyle: „Fujifilm X-T5 + 35 mm f/1,4 bei f/2,8, natürlicher ISO“
- Editorial: „Hasseblad H6D-100C + 80-mm-Objektiv bei f/8, Mittelformat“
Das Modell verwendet diese als Stil-Token. Sie müssen die Kamera nicht unbedingt besitzen – Sie sagen dem Modell, aus welcher Bildverteilung es sampeln soll.
Das Seitenverhältnis ist wichtiger als Sie denken
Wählen Sie Ihr Verhältnis, bevor Sie die Eingabeaufforderung schreiben, nicht danach. Ein 1:1-Quadrat und ein 16:9-Querformat sind nicht dasselbe zugeschnittene Bild – sie setzen sich im latenten Raum des Modells unterschiedlich zusammen.
- 1:1: Social-Media-Beiträge, Miniaturansichten, Profilbilder
- 4:5: Instagram-Feed, Pinterest
- 9:16: Geschichten, Reels, TikTok
- 16:9: Hero-Banner, YouTube-Miniaturansichten, Landingpage-Hero
- 3:2: Editorial, Blog-Heldenbilder
- 2:3: Druck, Poster, Buchcover
Was man weglassen sollte
- „Sehr detailliert“ – überflüssig, fügt Rauschen hinzu
- „8K, 4K, HD“ – beeinträchtigt die Qualität nicht, verschwendet nur Token
- „Meisterwerk, preisgekrönt“ – löst eine generische Ästhetik aus
- Lange Stilstapel („von Greg Rutkowski im Stil von …“) – verwässert die Kontrolle
Die Iterationsschleife
Ich budgetiere drei Generationen pro endgültigem Bild:
- Erster Durchgang: vollständige Eingabeaufforderung wie geschrieben, 1 Bild
- Verfeinern: Passen Sie die Beleuchtung oder Kamera basierend auf dem Fehler beim ersten Rendern an
- Polieren: Komposition verschärfen, ein Detail hinzufügen oder entfernen
Wenn Sie GPT Image2 Studio Basic verwenden, sind das etwa 60–90 Credits (ungefähr 2–3 Nano Banana Pro-Renderings) pro Finale. Realistisch.
Die Ein-Satz-Regel
Wenn Ihre Eingabeaufforderung länger als zwei Sätze ist, verwirren Sie das Modell. Schneiden Sie es ab. Jedes Wort sollte seinen Platz verdienen.
Das Fazit
- Verwenden Sie die Fünf-Slot-Grammatik: Betreff → Aktion → Umgebung → Beleuchtung → Kamera. Jeder Schlitz ist in Ordnung, keine Adjektive sind am Ende aufgeschraubt.
- Entfernen Sie die Adjektiv-Dumps – „8k, Meisterwerk, sehr detailliert“ fügt Rauschen hinzu, nicht Qualität.
- Beleuchtung und Kamerasprache sind Ihr eigentlicher Hebel – benennen Sie das Fenster, benennen Sie das Objektiv.
- Wählen Sie das Seitenverhältnis, bevor Sie die Eingabeaufforderung schreiben, nicht danach. Unterschiedliche Verhältnisse sind unterschiedliche latente Zusammensetzungen, keine Nutzpflanzen.
- Planen Sie 3 Generationen pro endgültigem Bild ein – Sie werden iterieren. Erstellen Sie eine gewinnbringende Bibliothek nach Kategorien und verwenden Sie sie intensiv wieder.
Probieren Sie die Fünf-Slot-Grammatik auf Ihrem eigenen Produktfoto aus – jedes neue Konto beginnt mit 30 Credits und schaltet 30 weitere nach dem ersten erfolgreichen Bild frei: gptimg.app/.
Frequently asked questions
Do I need a credit card to try GPT Image2 Studio?
No. Every new account starts with 30 credits on signup, then unlocks 30 more after the first successful image. Paid plans only kick in if you want more than the free ceiling.
Can I use the generated images commercially?
Yes. Every tier, including the free starter credits, comes with full commercial rights. Run ads, sell products, print on merchandise, publish on any platform. No watermark, no attribution required.
Which model should I route to for what?
Hero ads and text-heavy creative fit GPT Image 1.5 high. Product and macro texture work fit Nano Banana Pro. High-volume social iteration fits Nano Banana 2. Fast drafts and mood boards fit Z Image. The workbench can route one prompt across all of them.
How fast is a single generation?
Z Image returns in about 10 seconds. Nano Banana 2 often returns in 15 to 20 seconds. Nano Banana Pro and GPT Image 1.5 high usually take 30 to 45 seconds for standard quality, and up to about a minute for 4K high quality.
What's the difference between GPT Image 1.5 high and Nano Banana 2?
GPT Image 1.5 high is stronger for text inside images and premium ad creative. Nano Banana 2 is faster and cheaper. In production, compare both with the same prompt before choosing the final image.
Can I edit an existing image instead of generating from scratch?
Yes. Upload a reference image, then continue with image-to-image, masked edits, background removal, object cleanup, or compression inside the same workflow.
Stop guessing the model.
Run all three.
We route your prompt to GPT Image 1.5 high, Nano Banana 2, Z Image and more — same workbench, same prompt, side-by-side blind compare. 30 credits on signup, another 30 after your first successful image, and commercial rights at every tier.
30 + 30
Free credits
5+
SOTA models
30s
To first render