第02章:AI 图片生成基础——Midjourney 与 DALL-E 快速上手

第02章:AI 图片生成基础——Midjourney 与 DALL-E 快速上手

“提示词是新一代的设计语言。你不需要会 Photoshop,不需要会素描,你只需要能用文字精确描述你想要什么。这是一种任何人都能学会的技能。”


一、Midjourney vs DALL-E:选哪个?

先做决定,再学工具:

Midjourney v7:
优势:
  → 艺术风格最强(时尚、生活方式、高端感)
  → 图片质感和光影效果顶级
  → 提示词「容错率」高,相对模糊的描述也能得到好结果
  → 社群资源丰富(可以偷看其他人的提示词)

劣势:
  → 需要 Discord,界面不直观
  → 文字渲染较差(英文还可以,中文几乎不可用)
  → 精确的产品描述有时会被「创意化」处理(AI 自由发挥)

DALL-E 3 (GPT-4o):
优势:
  → 文字理解最好(能理解复杂的中文指令)
  → 精确性高(「红色背景,左边放产品,右边写XX字」能做到)
  → 内置于 ChatGPT,不需要额外注册
  → 对话式修改(「把背景换成蓝色」「人物移到右边」)

劣势:
  → 艺术质量略逊于 Midjourney(尤其是时尚/生活方式图)
  → 每月生成次数有限制
  → 风格相对「商业化」,不够艺术感

推荐策略:
→ 广告图、产品图、需要精确文字:DALL-E 3
→ 品牌形象图、生活方式图、高端视觉:Midjourney
→ 入门学习:从 DALL-E 3 开始(已有 ChatGPT 账号的话零成本)

二、DALL-E 3 快速上手

打开 ChatGPT → 点击消息框左侧的「+」→ 选择「Image」→ 开始生成

最简单的开始方式:

第一步:直接描述你要的图片
「生成一张女性使用保湿霜的生活方式照片,
自然光,白色浴室背景,氛围感,高质量商业摄影风格」

第二步:查看生成结果,用对话继续调整
「背景换成浅灰色」
「人物衣服改为米白色」
「增加一些绿植作为道具」
「让光线更柔和,减少阴影」

第三步:满意后下载
→ 点击图片 → 下载

提示词结构(从简单到复杂):

简单版:
「[主体] + [场景/背景] + [风格]」

例:「一瓶护肤精华,放在大理石桌面上,极简主义风格」

完整版:
「[主体描述] + [场景/背景描述] + [光线描述] + [风格/氛围] + [技术参数]」

例:「一瓶深棕色的玻璃精华液,
放在白色大理石台面上,旁边点缀几片绿叶,
柔和的侧面自然光,温暖的下午阳光感,
极简高端风格,商业产品摄影,高分辨率」

三、Midjourney 快速上手

准备工作:
1. 注册 Discord(discord.com)
2. 访问 midjourney.com → Sign In → Connect Discord
3. 选择套餐(Basic $10/月,30 次生成/月)
4. 进入 Discord 中的 Midjourney 服务器,或添加 Midjourney Bot 到自己的服务器

基本命令:
在 Discord 消息框输入:
/imagine prompt: [你的提示词]

第一个提示词示例:
/imagine prompt: A woman applying moisturizer cream in a bright bathroom, natural window light, minimalist style, commercial photography --ar 1:1 --v 7

常用参数(放在提示词末尾):
--ar 1:1    → 正方形(适合 Instagram)
--ar 16:9   → 横版(适合 Facebook/YouTube)
--ar 9:16   → 竖版(适合 Stories/TikTok)
--v 7       → 使用最新版本(v7)
--style raw → 减少 AI 的「创意加工」,更写实
--q 2       → 最高质量(消耗更多积分)

生成后的操作:
U1/U2/U3/U4 → Upscale(放大细节)选择四张中的某一张
V1/V2/V3/V4 → Variation(变体)基于某一张继续变化
🔄 → 重新生成所有四张

专业小技巧:
→ 在公开的 Midjourney 服务器里,可以用「/imagine」后看别人的图
→ 点击任何你喜欢的图片,都能看到它的完整提示词
→ 复制提示词 → 稍作修改 → 用于自己的产品

四、提示词的核心语法

无论用哪个工具,好提示词都有共同结构:

一、主体描述
→ 你想要的核心元素是什么?
好:「一瓶深蓝色玻璃香水瓶」
差:「香水」

二、场景/背景
→ 主体在什么环境中?
好:「放在白色大理石台面上,背景是模糊的绿植」
差:「好看的背景」

三、光线
→ 光线是决定图片质感的关键
常用描述:
  natural window light(自然窗光)
  golden hour sunlight(黄金时段阳光)
  soft studio lighting(柔和棚光)
  dramatic side lighting(戏剧侧光)
  moody dark lighting(暗调氛围灯光)

四、风格/氛围
→ 告诉 AI 你想要什么「感觉」
常用描述:
  commercial photography(商业摄影风格)
  editorial style(杂志风)
  minimalist(极简主义)
  lifestyle photography(生活方式摄影)
  luxury / high-end(奢华高端)
  candid / authentic(真实/自然感)

五、技术描述(可选但有效)
→ 进一步控制质量和格式
常用描述:
  high resolution(高分辨率)
  4K / 8K(超高清)
  photorealistic(照片写实感)
  shallow depth of field(浅景深,背景虚化)
  product photography(产品摄影)

完整示例:
「A bottle of midnight blue glass perfume [主体]
sitting on a white marble surface with eucalyptus leaves [场景]
soft window light from the left [光线]
luxury editorial style, high-end fashion magazine [风格]
photorealistic, shallow depth of field, 4K [技术]」

五、AI 图片的常见问题和解决方法

问题一:AI 生成的图片里有奇怪的文字/乱码
原因:AI 图片生成对文字处理很差
解决:
→ DALL-E 3 对英文文字效果尚可,对中文几乎不可用
→ 解决方案:先生成没有文字的图片,再用 Canva/PS 叠加文字
→ 提示词中加「no text, no words」明确要求不要文字

问题二:生成的图片里有多余的手/手指(变形)
原因:AI 对手部和手指的处理是已知弱点
解决:
→ 提示词加「no hands, no fingers, product shot from above」
→ 使用产品平铺图(flatlay)风格,避免出现手
→ 如果必须有手,选择模糊/侧面角度,减少细节要求

问题三:产品和真实产品不一样
原因:AI 会「创意化」修改产品外观
解决:
→ 这是 AI 图片用于电商产品图的最大限制
→ 解决方案(下一章重点):用真实产品图作为「参考」
→ 或:用 AI 做背景,真实产品图叠加(合成)

问题四:生成的图片风格不稳定
原因:AI 每次生成都有随机性
解决:
→ DALL-E:在对话中不断微调,直到满意为止
→ Midjourney:使用 --seed [数字] 参数固定随机种子
→ 用 Midjourney 的「--cref」功能参考已有角色/风格

问题五:想要与某张参考图相似的风格
解决:
→ DALL-E 3:上传参考图 + 描述「按照这张图的风格生成」
→ Midjourney:[参考图URL] 放在提示词开头,会参考该图风格

六、100 个实用关键词速查

氛围关键词(Midjourney 效果最好):
moody / cozy / ethereal / vibrant / minimalist
editorial / cinematic / dreamy / sophisticated / raw

光线关键词:
golden hour / overcast / studio light / neon glow
candlelight / backlight / soft diffused / harsh shadows

风格关键词:
commercial photography / stock photo style / magazine editorial
Instagram aesthetic / Pinterest style / luxury brand

背景关键词(电商常用):
white background / gradient background / marble texture
wooden table / linen fabric / pastel colors
outdoor lifestyle / urban environment / cozy interior

产品关键词:
product hero shot / lifestyle product / in-use shot
overhead flat lay / side angle / dramatic close-up

人物关键词(避免版权问题):
anonymous person / silhouette / hand only / partial figure
diverse model (avoid specifying real people)

质量关键词:
ultra detailed / photorealistic / 8K resolution
professional photography / award winning / masterpiece
→ 注意:「masterpiece」在最新版 Midjourney 中效果已减弱,可忽略

本章小结

  1. DALL-E 3 入门首选:文字理解最好,操作简单,ChatGPT 用户零额外成本,对话式修改非常直观。

  2. Midjourney 进阶必学:艺术质感最高,尤其适合生活方式图和品牌形象图,值得学习 Discord 操作。

  3. 提示词 = 主体 + 场景 + 光线 + 风格 + 技术:五要素结构能覆盖 90% 的素材需求,从简单开始逐步扩展。

  4. AI 对文字处理很差:不要期待 AI 生成带有准确文字的图片,文字永远用后期叠加。

  5. 真实产品图 + AI 背景是电商最佳实践:AI 做场景和氛围,真实产品图确保准确性,两者合成是黄金公式。

核心行动建议: 今天在 ChatGPT 中用 DALL-E 3 生成你第一张素材。选择你最熟悉的产品,用这个模板开始:「[产品名称],放在[背景描述]上,[光线],[风格],商业产品摄影风格」。生成后用对话修改 2-3 次,感受 AI 的响应。


本章提示词模板

产品图提示词生成器

请帮我为以下产品生成 5 个 AI 图片提示词:

产品:[产品名称和简短描述]
颜色/外观:[产品的主要颜色和材质]
目标用途:[广告/社交媒体/产品详情页/官网横幅]
目标风格:[极简/高端/自然/活力/温暖/酷炫/其他]
参考品牌风格(可选):[例如:类似 Glossier 的 Instagram 风格]

对于每个提示词,请提供:
1. 英文提示词(适合 Midjourney)
2. 中文描述(适合 DALL-E 3 / ChatGPT)
3. 这个方向适合在哪个广告场景使用

并额外提供:
- 2 个「模糊/氛围感」版本(适合品牌展示)
- 2 个「清晰/产品主图」版本(适合转化广告)
- 1 个「生活方式/使用场景」版本(适合社交媒体)

→ 继续阅读:第03章 电商产品图——AI 生成白底图、场景图、生活方式图