Schnelles Handwerk

Das schnelle Engineering-Playbook für Nano Banana Pro

Struktur, Beleuchtung, Komposition und Kamerasprache sind die entscheidenden Faktoren, wenn es darum geht, Nano Banana Pro für kommerzielle Arbeiten zu gewinnen.

Sarah Thompson

2026/04/14·4 min read

Zuletzt geprüft · 2026/04/14

Das schnelle Engineering-Playbook für Nano Banana Pro

Die erste kommerzielle Aufforderung, die ich jemals für Nano Banana Pro geschrieben habe, war diese: „Eine wunderschöne Parfümflasche auf einer Marmoroberfläche, hochwertig, 8k, professionell.“

Was ich zurückbekam, war KI-Schwachsinn. Ich war wütend – ich hatte im Monat zuvor beobachtet, wie dieselbe Aufforderung einen großartigen Midjourney-Output hervorbrachte. Ich hätte fast dem Model die Schuld gegeben. Dann habe ich die Dokumente gelesen, an einem Wochenende hundert A/B-Eingabeaufforderungen durchgeführt und die eigentliche Regel herausgefunden.

Nano Banana Pro ist das wörtlichste Modell, das ich je verwendet habe. Das ist eine Funktion, kein Fehler – es macht genau das, was Sie ihm sagen. Das bedeutet, dass die Qualität Ihrer Ausgabe zu 80 % vom Schnellformat und zu 20 % vom Glück abhängt. Adjektiv-Dumps funktionieren nicht. Eine Fünf-Slot-Grammatik schon.

Hier ist die Struktur, die ich jetzt für jedes Werbeshooting verwende – dieselbe, von der ich wünschte, jemand hätte sie mir für mein erstes Wochenende gegeben.

Die Fünf-Slot-Eingabeaufforderung

[Subject] [Action/Pose] [Environment] [Lighting] [Camera + Lens]

Jeder Slot in Ordnung. Am Ende werden keine Adjektive hinzugefügt.

Schlecht:

eine wunderschöne Parfümflasche auf einer Marmoroberfläche, hochwertig, 8k, professionell

Gut:

Eine Parfümflasche aus klarem Glas mit goldfarbenem Verschluss, die aufrecht auf einer polierten weißen Marmorplatte steht, sanftes Morgenlicht aus einem nach Norden gerichteten Fenster, das einen sanften diagonalen Schatten wirft, aufgenommen mit einer Canon R5 mit einem 100-mm-Makroobjektiv bei f/5,6

Mit der zweiten Eingabeaufforderung erhalten Sie eine brauchbare Produktaufnahme. Der erste bringt Ihnen KI-Slop.

A clear glass perfume bottle with a gold-tone cap standing upright on a polished white marble slab, soft morning light from a north-facing window casting a gentle diagonal shadow, macro lens at f/5.6, editorial product photography, muted warm neutral palette

Verwenden Sie das Fünf-Slot-Format für ein echtes Produktbild-Briefing.

Erstellen Sie drei Versionen und überprüfen Sie dann die Form des Motivs, die Beleuchtungsrichtung und die Materialtextur, bevor Sie mit der Bearbeitung beginnen.

Testen Sie diese Produktaufforderung

Lichtsprache, die funktioniert

„Weiches Morgenlicht aus Nordfenster“ → gleichmäßig, produktschonend
„Hartes Overhead-Studiolicht mit schwarzer Bounce-Karte auf der linken Seite“ → kontrastreich, Leitartikel
„Goldene Stunde Seitenlicht vom rechten Rahmen, warme Farbtemperatur“ → Lifestyle, Outdoor
„Bewölktes Tageslicht, diffus, keine sichtbaren Schatten“ → technische/spezifizierte Bilder

Vermeiden Sie: „filmische Beleuchtung“, „dramatische Beleuchtung“, „perfekte Beleuchtung“. Diese Adjektive weisen das Modell nicht auf etwas Bestimmtes hin.

Four identical matte ceramic mugs arranged in a two by two grid, each lit differently — top left soft north window light, top right hard overhead studio with a black bounce card, bottom left warm golden hour side light, bottom right overcast diffuse daylight — same framing same neutral background only the lighting changes, editorial product photography

Kamerasprache, die funktioniert

Nano Banana Pro reagiert auf echte Kameraausrüstung. Drei sichere Vorlagen:

Produkt: „Canon R5 + 100 mm Makroobjektiv bei f/5,6“
Lifestyle: „Fujifilm X-T5 + 35 mm f/1,4 bei f/2,8, natürlicher ISO“
Editorial: „Hasseblad H6D-100C + 80-mm-Objektiv bei f/8, Mittelformat“

Das Modell verwendet diese als Stil-Token. Sie müssen die Kamera nicht unbedingt besitzen – Sie sagen dem Modell, aus welcher Bildverteilung es sampeln soll.

Editorial portrait of a thoughtful woman in a deep blue wool coat, soft north window light, muted warm neutral palette with faint cyan undertone, crisp skin texture with natural imperfections, medium format Hasselblad aesthetic, shallow depth of field, clean neutral grey background

Das Seitenverhältnis ist wichtiger als Sie denken

Wählen Sie Ihr Verhältnis, bevor Sie die Eingabeaufforderung schreiben, nicht danach. Ein 1:1-Quadrat und ein 16:9-Querformat sind nicht dasselbe zugeschnittene Bild – sie setzen sich im latenten Raum des Modells unterschiedlich zusammen.

1:1: Social-Media-Beiträge, Miniaturansichten, Profilbilder
4:5: Instagram-Feed, Pinterest
9:16: Geschichten, Reels, TikTok
16:9: Hero-Banner, YouTube-Miniaturansichten, Landingpage-Hero
3:2: Editorial, Blog-Heldenbilder
2:3: Druck, Poster, Buchcover

Was man weglassen sollte

„Sehr detailliert“ – überflüssig, fügt Rauschen hinzu
„8K, 4K, HD“ – beeinträchtigt die Qualität nicht, verschwendet nur Token
„Meisterwerk, preisgekrönt“ – löst eine generische Ästhetik aus
Lange Stilstapel („von Greg Rutkowski im Stil von …“) – verwässert die Kontrolle

Die Iterationsschleife

Ich budgetiere drei Generationen pro endgültigem Bild:

Erster Durchgang: vollständige Eingabeaufforderung wie geschrieben, 1 Bild
Verfeinern: Passen Sie die Beleuchtung oder Kamera basierend auf dem Fehler beim ersten Rendern an
Polieren: Komposition verschärfen, ein Detail hinzufügen oder entfernen

Wenn Sie GPT Image2 Studio Basic verwenden, sind das etwa 60–90 Credits (ungefähr 2–3 Nano Banana Pro-Renderings) pro Finale. Realistisch.

Die Ein-Satz-Regel

Wenn Ihre Eingabeaufforderung länger als zwei Sätze ist, verwirren Sie das Modell. Schneiden Sie es ab. Jedes Wort sollte seinen Platz verdienen.

Das Fazit

Verwenden Sie die Fünf-Slot-Grammatik: Betreff → Aktion → Umgebung → Beleuchtung → Kamera. Jeder Schlitz ist in Ordnung, keine Adjektive sind am Ende aufgeschraubt.
Entfernen Sie die Adjektiv-Dumps – „8k, Meisterwerk, sehr detailliert“ fügt Rauschen hinzu, nicht Qualität.
Beleuchtung und Kamerasprache sind Ihr eigentlicher Hebel – benennen Sie das Fenster, benennen Sie das Objektiv.
Wählen Sie das Seitenverhältnis, bevor Sie die Eingabeaufforderung schreiben, nicht danach. Unterschiedliche Verhältnisse sind unterschiedliche latente Zusammensetzungen, keine Nutzpflanzen.
Planen Sie 3 Generationen pro endgültigem Bild ein – Sie werden iterieren. Erstellen Sie eine gewinnbringende Bibliothek nach Kategorien und verwenden Sie sie intensiv wieder.

Probieren Sie die Fünf-Slot-Grammatik auf Ihrem eigenen Produktfoto aus – jedes neue Konto beginnt mit 30 Credits und schaltet 30 weitere nach dem ersten erfolgreichen Bild frei: gptimg.app/.

Häufige Fragen

Brauche ich eine Kreditkarte, um GPT Image2 Studio zu testen?

Nein. Jedes neue Konto startet mit 30 Credits und schaltet nach dem ersten erfolgreichen Bild weitere 30 frei. Bezahlte Tarife werden erst relevant, wenn Sie über das kostenlose Limit hinausgehen möchten.

Darf ich generierte Bilder kommerziell nutzen?

Ja. Jeder Tarif, auch die kostenlosen Start-Credits, enthält volle kommerzielle Rechte. Nutzen Sie die Bilder für Anzeigen, Produkte, Merchandise oder Veröffentlichungen auf jeder Plattform. Kein Wasserzeichen, keine Pflichtnennung.

Welches Modell passt zu welcher Aufgabe?

Hero-Anzeigen und textlastige Creatives passen zu GPT Image 1.5 high. Produkt- und Makrotexturen passen zu Nano Banana Pro. Hohe Social-Iteration passt zu Nano Banana 2. Schnelle Entwürfe und Moodboards passen zu Z Image. Die Workbench kann einen Prompt an alle Modelle senden.

Wie schnell ist eine einzelne Generierung?

Z Image liefert oft in etwa 10 Sekunden. Nano Banana 2 braucht meist 15 bis 20 Sekunden. Nano Banana Pro und GPT Image 1.5 high benötigen für Standardqualität meist 30 bis 45 Sekunden und für 4K high quality bis zu etwa eine Minute.

Was ist der Unterschied zwischen GPT Image 1.5 high und Nano Banana 2?

GPT Image 1.5 high ist stärker bei Text im Bild und Premium-Ad-Creatives. Nano Banana 2 ist schneller und günstiger. In der Produktion sollten beide mit demselben Prompt verglichen werden, bevor das finale Bild gewählt wird.

Kann ich ein vorhandenes Bild bearbeiten, statt neu zu generieren?

Ja. Laden Sie ein Referenzbild hoch und fahren Sie im selben Workflow mit Bild-zu-Bild, Maskenbearbeitung, Hintergrundentfernung, Objektbereinigung oder Kompression fort.

GPT Image2 Studio

Hören Sie auf, das Modell zu erraten.
Lassen Sie alle drei laufen.

Wir routen Ihren Prompt an GPT Image 1.5 high, Nano Banana 2, Z Image und weitere Modelle — dieselbe Workbench, derselbe Prompt, blinder Vergleich nebeneinander. 30 Credits bei Registrierung, weitere 30 nach dem ersten erfolgreichen Bild und kommerzielle Rechte in jedem Tarif.

30 + 30

Kostenlose Credits

SOTA-Modelle

30s

Bis zum ersten Render

Workbench kostenlos testen Preise ansehen

Keine Kreditkarte nötig. Jederzeit kündbar.

Alle Artikel

Schnelles Handwerk

Das schnelle Engineering-Playbook für Nano Banana Pro

Struktur, Beleuchtung, Komposition und Kamerasprache sind die entscheidenden Faktoren, wenn es darum geht, Nano Banana Pro für kommerzielle Arbeiten zu gewinnen.

Sarah Thompson

2026/04/14·4 min read

Zuletzt geprüft · 2026/04/14

Hier ist die Struktur, die ich jetzt für jedes Werbeshooting verwende – dieselbe, von der ich wünschte, jemand hätte sie mir für mein erstes Wochenende gegeben.

Die Fünf-Slot-Eingabeaufforderung

[Subject] [Action/Pose] [Environment] [Lighting] [Camera + Lens]

Jeder Slot in Ordnung. Am Ende werden keine Adjektive hinzugefügt.

Schlecht:

eine wunderschöne Parfümflasche auf einer Marmoroberfläche, hochwertig, 8k, professionell

Gut:

Mit der zweiten Eingabeaufforderung erhalten Sie eine brauchbare Produktaufnahme. Der erste bringt Ihnen KI-Slop.

Verwenden Sie das Fünf-Slot-Format für ein echtes Produktbild-Briefing.

Erstellen Sie drei Versionen und überprüfen Sie dann die Form des Motivs, die Beleuchtungsrichtung und die Materialtextur, bevor Sie mit der Bearbeitung beginnen.

Testen Sie diese Produktaufforderung

Lichtsprache, die funktioniert

„Weiches Morgenlicht aus Nordfenster“ → gleichmäßig, produktschonend
„Hartes Overhead-Studiolicht mit schwarzer Bounce-Karte auf der linken Seite“ → kontrastreich, Leitartikel
„Goldene Stunde Seitenlicht vom rechten Rahmen, warme Farbtemperatur“ → Lifestyle, Outdoor
„Bewölktes Tageslicht, diffus, keine sichtbaren Schatten“ → technische/spezifizierte Bilder

Vermeiden Sie: „filmische Beleuchtung“, „dramatische Beleuchtung“, „perfekte Beleuchtung“. Diese Adjektive weisen das Modell nicht auf etwas Bestimmtes hin.

Kamerasprache, die funktioniert

Nano Banana Pro reagiert auf echte Kameraausrüstung. Drei sichere Vorlagen:

Produkt: „Canon R5 + 100 mm Makroobjektiv bei f/5,6“
Lifestyle: „Fujifilm X-T5 + 35 mm f/1,4 bei f/2,8, natürlicher ISO“
Editorial: „Hasseblad H6D-100C + 80-mm-Objektiv bei f/8, Mittelformat“

Das Modell verwendet diese als Stil-Token. Sie müssen die Kamera nicht unbedingt besitzen – Sie sagen dem Modell, aus welcher Bildverteilung es sampeln soll.

Das Seitenverhältnis ist wichtiger als Sie denken

1:1: Social-Media-Beiträge, Miniaturansichten, Profilbilder
4:5: Instagram-Feed, Pinterest
9:16: Geschichten, Reels, TikTok
16:9: Hero-Banner, YouTube-Miniaturansichten, Landingpage-Hero
3:2: Editorial, Blog-Heldenbilder
2:3: Druck, Poster, Buchcover

Was man weglassen sollte

„Sehr detailliert“ – überflüssig, fügt Rauschen hinzu
„8K, 4K, HD“ – beeinträchtigt die Qualität nicht, verschwendet nur Token
„Meisterwerk, preisgekrönt“ – löst eine generische Ästhetik aus
Lange Stilstapel („von Greg Rutkowski im Stil von …“) – verwässert die Kontrolle

Die Iterationsschleife

Ich budgetiere drei Generationen pro endgültigem Bild:

Erster Durchgang: vollständige Eingabeaufforderung wie geschrieben, 1 Bild
Verfeinern: Passen Sie die Beleuchtung oder Kamera basierend auf dem Fehler beim ersten Rendern an
Polieren: Komposition verschärfen, ein Detail hinzufügen oder entfernen

Wenn Sie GPT Image2 Studio Basic verwenden, sind das etwa 60–90 Credits (ungefähr 2–3 Nano Banana Pro-Renderings) pro Finale. Realistisch.

Die Ein-Satz-Regel

Wenn Ihre Eingabeaufforderung länger als zwei Sätze ist, verwirren Sie das Modell. Schneiden Sie es ab. Jedes Wort sollte seinen Platz verdienen.

Das Fazit

Verwenden Sie die Fünf-Slot-Grammatik: Betreff → Aktion → Umgebung → Beleuchtung → Kamera. Jeder Schlitz ist in Ordnung, keine Adjektive sind am Ende aufgeschraubt.
Entfernen Sie die Adjektiv-Dumps – „8k, Meisterwerk, sehr detailliert“ fügt Rauschen hinzu, nicht Qualität.
Beleuchtung und Kamerasprache sind Ihr eigentlicher Hebel – benennen Sie das Fenster, benennen Sie das Objektiv.
Wählen Sie das Seitenverhältnis, bevor Sie die Eingabeaufforderung schreiben, nicht danach. Unterschiedliche Verhältnisse sind unterschiedliche latente Zusammensetzungen, keine Nutzpflanzen.
Planen Sie 3 Generationen pro endgültigem Bild ein – Sie werden iterieren. Erstellen Sie eine gewinnbringende Bibliothek nach Kategorien und verwenden Sie sie intensiv wieder.

Häufige Fragen

Brauche ich eine Kreditkarte, um GPT Image2 Studio zu testen?

Darf ich generierte Bilder kommerziell nutzen?

Welches Modell passt zu welcher Aufgabe?

Wie schnell ist eine einzelne Generierung?

Was ist der Unterschied zwischen GPT Image 1.5 high und Nano Banana 2?

Kann ich ein vorhandenes Bild bearbeiten, statt neu zu generieren?

Ja. Laden Sie ein Referenzbild hoch und fahren Sie im selben Workflow mit Bild-zu-Bild, Maskenbearbeitung, Hintergrundentfernung, Objektbereinigung oder Kompression fort.

GPT Image2 Studio

Hören Sie auf, das Modell zu erraten.
Lassen Sie alle drei laufen.

30 + 30

Kostenlose Credits

SOTA-Modelle

30s

Bis zum ersten Render

Workbench kostenlos testen Preise ansehen

Keine Kreditkarte nötig. Jederzeit kündbar.

Die Fünf-Slot-Eingabeaufforderung

Lichtsprache, die funktioniert

Kamerasprache, die funktioniert

Das Seitenverhältnis ist wichtiger als Sie denken

Was man weglassen sollte

Die Iterationsschleife

Die Ein-Satz-Regel

Das Fazit

Häufige Fragen

Hören Sie auf, das Modell zu erraten.Lassen Sie alle drei laufen.

Die Fünf-Slot-Eingabeaufforderung

Lichtsprache, die funktioniert

Kamerasprache, die funktioniert

Das Seitenverhältnis ist wichtiger als Sie denken

Was man weglassen sollte

Die Iterationsschleife

Die Ein-Satz-Regel

Das Fazit

Häufige Fragen

Hören Sie auf, das Modell zu erraten.Lassen Sie alle drei laufen.

Hören Sie auf, das Modell zu erraten.
Lassen Sie alle drei laufen.

Hören Sie auf, das Modell zu erraten.
Lassen Sie alle drei laufen.