第02章:提示词写法——AI图像提示词和文字提示词的根本差异
第02章:提示词写法——AI图像提示词和文字提示词的根本差异
有人从写ChatGPT提示词直接跨到写AI图像提示词,然后发现出的图很差,就认为是工具不行或者自己没天赋。
其实是转移路径出了问题。
文字AI提示词的核心逻辑是:描述清楚你要做什么,给足背景信息,AI理解你的意图,然后执行。
图像AI提示词的核心逻辑完全不同:你在描述一个视觉画面,不是描述一个任务。你描述的每一个词,AI都会尝试在画面里体现出来。
这是根本性的差异,不是技巧上的差异。
为什么"自然语言描述"在图像AI里经常不管用
一个文字AI提示词可能是这样的:
“帮我写一篇关于2026年AI图像行业趋势的分析文章,1500字,面向设计师读者”
这是典型的"任务描述"——你在告诉AI你要它做什么。
如果用同样的逻辑写图像提示词:
“画一张关于2026年AI图像行业趋势的图,面向设计师读者”
结果很可能是一张抽象、模糊、毫无商业价值的图——因为你没有描述任何具体的视觉元素。
图像AI的提示词需要描述的是:
- 画面里有什么(主体)
- 主体是什么状态/姿势/表情
- 背景是什么
- 光线/色调
- 风格/质感
- 构图方式
这更像是在给摄影师或插画师下指令,而不是在给程序员描述需求。
图像提示词的四层结构
第一层:主体(Subject)
画面里最重要的东西是什么?
不要说"一件连衣裙",而是:
“一件浅粉色真丝面料的A字裙,裙摆微微飘起,搭配白色细腰带”
主体描述的关键原则:
- 具体,不模糊(颜色/材质/状态/细节)
- 先说最重要的特征,再说次要特征
- 避免否定描述("没有花纹"这类AI不善于处理)
第二层:环境(Environment)
主体在哪里?
“放置在柔和自然光照射的白色简约展台上,背景是浅灰色布景”
或者:
“穿着连衣裙的女性站在午后阳光下的花园里,背景是虚化的绿色灌木”
环境的重要性被严重低估。同样的主体,放在不同环境里,传达的信息和情绪完全不同。
第三层:风格与质感(Style & Texture)
这张图看起来像什么类型的作品?
product photography(产品摄影风格)editorial fashion photography(时尚大片)flat lay(俯拍平铺)anime illustration(动漫插画)watercolor(水彩风格)cinematic still(电影感)minimalist design(极简设计)
专业关键词比描述更有效。AI已经被喂了大量专业图像,用行业术语描述风格,比用自然语言描述效果准确得多。
第四层:技术参数(Technical)
控制输出质量和格式的参数:
- 分辨率相关:
8K, ultra detailed, sharp focus - 光线相关:
golden hour lighting, soft studio light, dramatic shadows - 构图相关:
close-up, wide angle, bird's eye view, rule of thirds - 品质强调:
photorealistic, high quality, masterpiece
商业场景的提示词模板
电商产品主图
[产品描述,包含颜色/材质/形状的具体细节],
placed on a clean white platform with soft natural light,
product photography style,
studio lighting, no shadows on background,
ultra-detailed, 8K resolution, sharp focus
中文版:
[具体描述产品:颜色/材质/形状],
放置在干净的白色简约展台上,柔和自然光,
产品摄影风格,
无背景阴影,灯箱质感,
超精细细节,锐利对焦
小红书/Instagram氛围图
[人物描述:年龄感/风格/动作],
in [场景,比如:a cozy minimal apartment / a sunlit cafe],
warm golden light streaming through the window,
lifestyle photography, Canon EOS R5 style,
aesthetic, authentic, natural colors
品牌海报(有文字,用Ideogram)
[品牌名/口号] in [字体描述:bold sans-serif / elegant serif],
[颜色组合] color palette,
[设计元素描述],
clean minimal layout, professional design
提示词写法的进阶技巧
技巧1:用参照物定义风格
直接引用大家都知道的视觉参照,比描述更精确:
in the style of MUJI advertising photography(无印良品广告摄影风格)like a Kinfolk magazine spread(Kinfolk杂志风格)Studio Ghibli aesthetic(吉卜力画风)Apple product launch photography(苹果发布会产品图风格)
注意:Midjourney等工具对版权敏感内容有限制,直接写具体摄影师名字效果越来越差,描述风格而不是描述人名更可靠。
技巧2:用权重控制强调(Midjourney专用)
在Midjourney里,可以用::数字控制词语权重:
red dress::2, white studio background::1, fashion photography::1.5
数字越大,这个元素越重要。常用于强调主体,压制背景。
技巧3:负面提示词(Flux/SD类工具)
告诉AI你不想要的:
negative prompt: blurry, low quality, watermark, text overlay, deformed hands, ugly, oversaturated, cartoon
Midjourney的对应写法:在提示词末尾加--no [不想要的内容]
技巧4:参考图 + 文本(垫图)
当你有一张想要达到类似效果的参考图时,先上传参考图,再写描述,AI会将参考图的风格/构图融入生成。
这在接客户单时非常有价值——客户发给你一张他喜欢的参考图,你可以作为垫图。
提示词练习方法
单变量练习法:
选一个基础提示词,每次只改变一个变量,观察效果变化。比如:
基础:a coffee cup on a wooden table, product photography
然后分别改变:
- 背景:换成
marble surface/concrete/linen cloth - 光线:换成
morning sunlight/candlelight/neon light - 风格:换成
flat lay/close-up macro/wide angle
这样练习50次,比看50个教程更有价值。
如果今天只记一件事:图像AI提示词是在描述一幅画,不是在描述一个任务。学会用"主体+环境+风格+技术参数"四层结构写提示词,比学任何高级技巧都更管用。