第02章：提示词写法——AI图像提示词和文字提示词的根本差异

有人从写ChatGPT提示词直接跨到写AI图像提示词，然后发现出的图很差，就认为是工具不行或者自己没天赋。

其实是转移路径出了问题。

文字AI提示词的核心逻辑是：描述清楚你要做什么，给足背景信息，AI理解你的意图，然后执行。

图像AI提示词的核心逻辑完全不同：你在描述一个视觉画面，不是描述一个任务。你描述的每一个词，AI都会尝试在画面里体现出来。

这是根本性的差异，不是技巧上的差异。

为什么"自然语言描述"在图像AI里经常不管用

一个文字AI提示词可能是这样的：

“帮我写一篇关于2026年AI图像行业趋势的分析文章，1500字，面向设计师读者”

这是典型的"任务描述"——你在告诉AI你要它做什么。

如果用同样的逻辑写图像提示词：

“画一张关于2026年AI图像行业趋势的图，面向设计师读者”

结果很可能是一张抽象、模糊、毫无商业价值的图——因为你没有描述任何具体的视觉元素。

图像AI的提示词需要描述的是：

画面里有什么（主体）
主体是什么状态/姿势/表情
背景是什么
光线/色调
风格/质感
构图方式

这更像是在给摄影师或插画师下指令，而不是在给程序员描述需求。

图像提示词的四层结构

第一层：主体（Subject）

画面里最重要的东西是什么？

不要说"一件连衣裙"，而是：

“一件浅粉色真丝面料的A字裙，裙摆微微飘起，搭配白色细腰带”

主体描述的关键原则：

具体，不模糊（颜色/材质/状态/细节）
先说最重要的特征，再说次要特征
避免否定描述（"没有花纹"这类AI不善于处理）

第二层：环境（Environment）

主体在哪里？

“放置在柔和自然光照射的白色简约展台上，背景是浅灰色布景”

或者：

“穿着连衣裙的女性站在午后阳光下的花园里，背景是虚化的绿色灌木”

环境的重要性被严重低估。同样的主体，放在不同环境里，传达的信息和情绪完全不同。

第三层：风格与质感（Style & Texture）

这张图看起来像什么类型的作品？

product photography（产品摄影风格）
editorial fashion photography（时尚大片）
flat lay（俯拍平铺）
anime illustration（动漫插画）
watercolor（水彩风格）
cinematic still（电影感）
minimalist design（极简设计）

专业关键词比描述更有效。AI已经被喂了大量专业图像，用行业术语描述风格，比用自然语言描述效果准确得多。

第四层：技术参数（Technical）

控制输出质量和格式的参数：

分辨率相关：8K, ultra detailed, sharp focus
光线相关：golden hour lighting, soft studio light, dramatic shadows
构图相关：close-up, wide angle, bird's eye view, rule of thirds
品质强调：photorealistic, high quality, masterpiece

商业场景的提示词模板

电商产品主图

[产品描述，包含颜色/材质/形状的具体细节],
placed on a clean white platform with soft natural light,
product photography style,
studio lighting, no shadows on background,
ultra-detailed, 8K resolution, sharp focus

中文版：

[具体描述产品：颜色/材质/形状]，
放置在干净的白色简约展台上，柔和自然光，
产品摄影风格，
无背景阴影，灯箱质感，
超精细细节，锐利对焦

小红书/Instagram氛围图

[人物描述：年龄感/风格/动作],
in [场景，比如：a cozy minimal apartment / a sunlit cafe],
warm golden light streaming through the window,
lifestyle photography, Canon EOS R5 style,
aesthetic, authentic, natural colors

品牌海报（有文字，用Ideogram）

[品牌名/口号] in [字体描述：bold sans-serif / elegant serif],
[颜色组合] color palette,
[设计元素描述],
clean minimal layout, professional design

提示词写法的进阶技巧

技巧1：用参照物定义风格

直接引用大家都知道的视觉参照，比描述更精确：

in the style of MUJI advertising photography（无印良品广告摄影风格）
like a Kinfolk magazine spread（Kinfolk杂志风格）
Studio Ghibli aesthetic（吉卜力画风）
Apple product launch photography（苹果发布会产品图风格）

注意：Midjourney等工具对版权敏感内容有限制，直接写具体摄影师名字效果越来越差，描述风格而不是描述人名更可靠。

技巧2：用权重控制强调（Midjourney专用）

在Midjourney里，可以用::数字控制词语权重：

red dress::2, white studio background::1, fashion photography::1.5

数字越大，这个元素越重要。常用于强调主体，压制背景。

技巧3：负面提示词（Flux/SD类工具）

告诉AI你不想要的：

negative prompt: blurry, low quality, watermark, text overlay, deformed hands, ugly, oversaturated, cartoon

Midjourney的对应写法：在提示词末尾加--no [不想要的内容]

技巧4：参考图 + 文本（垫图）

当你有一张想要达到类似效果的参考图时，先上传参考图，再写描述，AI会将参考图的风格/构图融入生成。

这在接客户单时非常有价值——客户发给你一张他喜欢的参考图，你可以作为垫图。

提示词练习方法

单变量练习法：

选一个基础提示词，每次只改变一个变量，观察效果变化。比如：

基础：a coffee cup on a wooden table, product photography

然后分别改变：

背景：换成marble surface / concrete / linen cloth
光线：换成morning sunlight / candlelight / neon light
风格：换成flat lay / close-up macro / wide angle

这样练习50次，比看50个教程更有价值。

如果今天只记一件事：图像AI提示词是在描述一幅画，不是在描述一个任务。学会用"主体+环境+风格+技术参数"四层结构写提示词，比学任何高级技巧都更管用。