Buku pedoman rekayasa cepat untuk Nano Banana Pro
Struktur, pencahayaan, komposisi, dan bahasa kamera yang benar-benar menggerakkan jarum saat mendorong Nano Banana Pro untuk karya komersial.
Sarah Thompson
·4 min read

Perintah komersial pertama yang pernah saya tulis untuk Nano Banana Pro adalah ini: "sebotol parfum cantik di permukaan marmer, kualitas tinggi, 8k, profesional."
Apa yang saya dapatkan kembali adalah AI slop. Saya sangat marah - saya telah menyaksikan prompt yang sama menghasilkan keluaran Midjourney yang indah pada bulan sebelumnya. Saya hampir menyalahkan modelnya. Lalu saya membaca dokumennya, menjalankan seratus perintah A/B di akhir pekan, dan menemukan aturan sebenarnya.
Nano Banana Pro adalah model paling literal yang pernah saya gunakan. Itu adalah fitur, bukan bug — ia melakukan persis seperti yang Anda perintahkan. Artinya kualitas keluaran Anda adalah 80% format prompt, 20% keberuntungan. Pembuangan kata sifat tidak berfungsi. Tata bahasa lima slot dapat melakukannya.
Inilah struktur yang sekarang saya gunakan untuk setiap pengambilan gambar komersial — struktur yang sama yang saya harap seseorang berikan kepada saya pada akhir pekan pertama saya.
Prompt lima slot
[Subject] [Action/Pose] [Environment] [Lighting] [Camera + Lens]Setiap slot berurutan. Tidak ada kata sifat yang dilontarkan di akhir.
Buruk:
sebotol parfum cantik di permukaan marmer, kualitas tinggi, 8k, profesional
Bagus:
Botol parfum kaca bening dengan tutup berwarna emas, berdiri tegak di atas lempengan marmer putih yang dipoles, cahaya pagi yang lembut dari jendela yang menghadap ke utara menghasilkan bayangan diagonal yang lembut, dibidik pada Canon R5 dengan lensa makro 100mm pada f/5.6
Perintah kedua memberi Anda gambaran produk yang dapat digunakan. Yang pertama membuat Anda gagal dalam AI.
Gunakan format lima slot pada ringkasan gambar produk nyata.
Hasilkan tiga versi, lalu periksa bentuk subjek, arah pencahayaan, dan tekstur material sebelum Anda meluangkan waktu untuk mengedit.
Bahasa pencahayaan yang berfungsi
- "Cahaya pagi yang lembut dari jendela yang menghadap ke utara" → merata, ramah produk
- "Lampu studio keras di atas kepala dengan kartu pantulan hitam di sebelah kiri" → editorial kontras tinggi
- "Lampu samping jam emas dari bingkai kanan, suhu warna hangat" → gaya hidup, luar ruangan
- "Siang hari mendung, menyebar, tidak ada bayangan yang terlihat" → citra teknis/spesifikasi
Hindari: "pencahayaan sinematik", "pencahayaan dramatis", "pencahayaan sempurna". Kata sifat ini tidak mengarahkan model pada sesuatu yang spesifik.
Bahasa kamera yang berfungsi
Nano Banana Pro merespons perlengkapan kamera sebenarnya. Tiga templat aman:
- Produk: "Lensa makro Canon R5 + 100mm pada f/5.6"
- Gaya Hidup: "Fujifilm X-T5 + 35mm f/1.4 pada f/2.8, ISO alami"
- Editorial: "Lensa Hasselblad H6D-100C + 80mm pada f/8, format medium"
Model menggunakan ini sebagai token gaya. Anda sebenarnya tidak perlu memiliki kamera — Anda memberi tahu model dari distribusi gambar mana yang akan diambil sampelnya.
Rasio aspek lebih penting dari yang Anda kira
Pilih rasio Anda sebelum Anda menulis prompt, bukan setelahnya. Persegi 1:1 dan lanskap 16:9 bukanlah gambar yang dipotong sama — komposisinya berbeda dalam ruang laten model.
- 1:1: postingan sosial, gambar mini, gambar profil
- 4:5: Umpan Instagram, Pinterest
- 9:16: cerita, gulungan, TikTok
- 16:9: spanduk pahlawan, gambar mini YouTube, pahlawan laman landas
- 3:2: editorial, gambar pahlawan blog
- 2:3: cetakan, poster, sampul buku
Apa yang harus ditinggalkan
- "Sangat detail" — mubazir, menambah kebisingan
- "8K, 4K, HD" — tidak memengaruhi kualitas, hanya membuang-buang token
- "Karya agung, pemenang penghargaan" — memicu estetika umum
- Tumpukan gaya panjang ("oleh Greg Rutkowski dalam gaya...") — melemahkan kontrol
Perulangan iterasi
Saya menganggarkan tiga generasi per gambar akhir:
- Lulus pertama: perintah lengkap seperti yang tertulis, 1 gambar
- Perbaiki: sesuaikan pencahayaan atau kamera berdasarkan kesalahan render pertama
- Bahasa Polandia: mengencangkan komposisi, menambah atau menghapus satu detail
Jika Anda menggunakan GPT Image2 Studio Basic, itu berarti ~60-90 kredit (kira-kira 2-3 render Nano Banana Pro) per final. Realistis.
Aturan satu kalimat
Jika perintah Anda lebih panjang dari dua kalimat, Anda membingungkan modelnya. Potong itu. Setiap kata harus mendapatkan tempatnya.
Intinya
- Gunakan tata bahasa lima slot: Subjek → Tindakan → Lingkungan → Pencahayaan → Kamera. Setiap slot berurutan, tidak ada kata sifat yang melesat di akhir.
- Hapus kata sifat dumps — "8k, mahakarya, sangat detail" menambah kebisingan, bukan kualitas.
- Pencahayaan dan bahasa kamera adalah tuas Anda yang sebenarnya — beri nama jendela, beri nama lensa.
- Pilih rasio aspek sebelum Anda menulis perintah, bukan setelahnya. Rasio yang berbeda berarti komposisi laten yang berbeda, bukan hasil panen.
- Anggaran 3 generasi per gambar akhir — Anda akan mengulanginya. Bangun perpustakaan yang unggul berdasarkan kategori dan gunakan kembali secara agresif.
Coba tata bahasa lima slot pada foto produk Anda sendiri — setiap akun baru dimulai dengan 30 kredit dan terbuka 30 kredit lagi setelah gambar pertama berhasil: gptimg.app/.
Frequently asked questions
Do I need a credit card to try GPT Image2 Studio?
No. Every new account starts with 30 credits on signup, then unlocks 30 more after the first successful image. Paid plans only kick in if you want more than the free ceiling.
Can I use the generated images commercially?
Yes. Every tier, including the free starter credits, comes with full commercial rights. Run ads, sell products, print on merchandise, publish on any platform. No watermark, no attribution required.
Which model should I route to for what?
Hero ads and text-heavy creative fit GPT Image 1.5 high. Product and macro texture work fit Nano Banana Pro. High-volume social iteration fits Nano Banana 2. Fast drafts and mood boards fit Z Image. The workbench can route one prompt across all of them.
How fast is a single generation?
Z Image returns in about 10 seconds. Nano Banana 2 often returns in 15 to 20 seconds. Nano Banana Pro and GPT Image 1.5 high usually take 30 to 45 seconds for standard quality, and up to about a minute for 4K high quality.
What's the difference between GPT Image 1.5 high and Nano Banana 2?
GPT Image 1.5 high is stronger for text inside images and premium ad creative. Nano Banana 2 is faster and cheaper. In production, compare both with the same prompt before choosing the final image.
Can I edit an existing image instead of generating from scratch?
Yes. Upload a reference image, then continue with image-to-image, masked edits, background removal, object cleanup, or compression inside the same workflow.
Stop guessing the model.
Run all three.
We route your prompt to GPT Image 1.5 high, Nano Banana 2, Z Image and more — same workbench, same prompt, side-by-side blind compare. 30 credits on signup, another 30 after your first successful image, and commercial rights at every tier.
30 + 30
Free credits
5+
SOTA models
30s
To first render


