第02章:提示词写法——AI图像提示词和文字提示词的根本差异

第02章:提示词写法——AI图像提示词和文字提示词的根本差异


有人从写ChatGPT提示词直接跨到写AI图像提示词,然后发现出的图很差,就认为是工具不行或者自己没天赋。

其实是转移路径出了问题。

文字AI提示词的核心逻辑是:描述清楚你要做什么,给足背景信息,AI理解你的意图,然后执行。

图像AI提示词的核心逻辑完全不同:你在描述一个视觉画面,不是描述一个任务。你描述的每一个词,AI都会尝试在画面里体现出来。

这是根本性的差异,不是技巧上的差异。


为什么"自然语言描述"在图像AI里经常不管用

一个文字AI提示词可能是这样的:

“帮我写一篇关于2026年AI图像行业趋势的分析文章,1500字,面向设计师读者”

这是典型的"任务描述"——你在告诉AI你要它做什么。

如果用同样的逻辑写图像提示词:

“画一张关于2026年AI图像行业趋势的图,面向设计师读者”

结果很可能是一张抽象、模糊、毫无商业价值的图——因为你没有描述任何具体的视觉元素。

图像AI的提示词需要描述的是:

  • 画面里有什么(主体)
  • 主体是什么状态/姿势/表情
  • 背景是什么
  • 光线/色调
  • 风格/质感
  • 构图方式

这更像是在给摄影师或插画师下指令,而不是在给程序员描述需求。


图像提示词的四层结构

第一层:主体(Subject)

画面里最重要的东西是什么?

不要说"一件连衣裙",而是:

“一件浅粉色真丝面料的A字裙,裙摆微微飘起,搭配白色细腰带”

主体描述的关键原则

  • 具体,不模糊(颜色/材质/状态/细节)
  • 先说最重要的特征,再说次要特征
  • 避免否定描述("没有花纹"这类AI不善于处理)

第二层:环境(Environment)

主体在哪里?

“放置在柔和自然光照射的白色简约展台上,背景是浅灰色布景”

或者:

“穿着连衣裙的女性站在午后阳光下的花园里,背景是虚化的绿色灌木”

环境的重要性被严重低估。同样的主体,放在不同环境里,传达的信息和情绪完全不同。

第三层:风格与质感(Style & Texture)

这张图看起来像什么类型的作品?

  • product photography(产品摄影风格)
  • editorial fashion photography(时尚大片)
  • flat lay(俯拍平铺)
  • anime illustration(动漫插画)
  • watercolor(水彩风格)
  • cinematic still(电影感)
  • minimalist design(极简设计)

专业关键词比描述更有效。AI已经被喂了大量专业图像,用行业术语描述风格,比用自然语言描述效果准确得多。

第四层:技术参数(Technical)

控制输出质量和格式的参数:

  • 分辨率相关:8K, ultra detailed, sharp focus
  • 光线相关:golden hour lighting, soft studio light, dramatic shadows
  • 构图相关:close-up, wide angle, bird's eye view, rule of thirds
  • 品质强调:photorealistic, high quality, masterpiece

商业场景的提示词模板

电商产品主图

[产品描述,包含颜色/材质/形状的具体细节],
placed on a clean white platform with soft natural light,
product photography style,
studio lighting, no shadows on background,
ultra-detailed, 8K resolution, sharp focus

中文版

[具体描述产品:颜色/材质/形状],
放置在干净的白色简约展台上,柔和自然光,
产品摄影风格,
无背景阴影,灯箱质感,
超精细细节,锐利对焦

小红书/Instagram氛围图

[人物描述:年龄感/风格/动作],
in [场景,比如:a cozy minimal apartment / a sunlit cafe],
warm golden light streaming through the window,
lifestyle photography, Canon EOS R5 style,
aesthetic, authentic, natural colors

品牌海报(有文字,用Ideogram)

[品牌名/口号] in [字体描述:bold sans-serif / elegant serif],
[颜色组合] color palette,
[设计元素描述],
clean minimal layout, professional design

提示词写法的进阶技巧

技巧1:用参照物定义风格

直接引用大家都知道的视觉参照,比描述更精确:

  • in the style of MUJI advertising photography(无印良品广告摄影风格)
  • like a Kinfolk magazine spread(Kinfolk杂志风格)
  • Studio Ghibli aesthetic(吉卜力画风)
  • Apple product launch photography(苹果发布会产品图风格)

注意:Midjourney等工具对版权敏感内容有限制,直接写具体摄影师名字效果越来越差,描述风格而不是描述人名更可靠。

技巧2:用权重控制强调(Midjourney专用)

在Midjourney里,可以用::数字控制词语权重:

red dress::2, white studio background::1, fashion photography::1.5

数字越大,这个元素越重要。常用于强调主体,压制背景。

技巧3:负面提示词(Flux/SD类工具)

告诉AI你不想要的:

negative prompt: blurry, low quality, watermark, text overlay, deformed hands, ugly, oversaturated, cartoon

Midjourney的对应写法:在提示词末尾加--no [不想要的内容]

技巧4:参考图 + 文本(垫图)

当你有一张想要达到类似效果的参考图时,先上传参考图,再写描述,AI会将参考图的风格/构图融入生成。

这在接客户单时非常有价值——客户发给你一张他喜欢的参考图,你可以作为垫图。


提示词练习方法

单变量练习法

选一个基础提示词,每次只改变一个变量,观察效果变化。比如:

基础:a coffee cup on a wooden table, product photography

然后分别改变:

  • 背景:换成marble surface / concrete / linen cloth
  • 光线:换成morning sunlight / candlelight / neon light
  • 风格:换成flat lay / close-up macro / wide angle

这样练习50次,比看50个教程更有价值。


如果今天只记一件事:图像AI提示词是在描述一幅画,不是在描述一个任务。学会用"主体+环境+风格+技术参数"四层结构写提示词,比学任何高级技巧都更管用。