第 02 章 30 分钟从零到第一张满意图

第 02 章 30 分钟从零到第一张满意图

「最难的不是出第一张图,是出第一张『让自己满意』的图。」

本章导读

如果你从未用过 ChatGPT 出图,本章是你的快速通道。30 分钟,三个小目标

  1. 登入账号 → 找到 Images 2.0 入口(5 分钟)
  2. 发出第一张「能用」的图(10 分钟)
  3. 通过对话把它改到「满意」(15 分钟)

如果你已经用过 DALL-E 3 或 Midjourney——别跳过本章。Images 2.0 的工作流和你想象的不一样:它不只是一个出图按钮,是一个会思考、会改图、会跟你来回沟通的设计师助理。用旧习惯写新工具的提示词,会浪费它 70% 的能力。

一、账号准备:哪个套餐能用 Images 2.0

的官方政策:

套餐 月费 Images 2.0 配额 思考模式 API 访问
Free $0 每日 3 张(低优先级)
Plus $20 每 3 小时 ~50 张
Pro $200 几乎无限 + 优先
Team $30/人 与 Plus 相当
Enterprise 商谈 自定义

强烈推荐 Plus 起步。Free 配额太低,不足以完成本书的练习;Pro 适合每天出图 > 50 张的重度用户(电商卖家、AIGC 全职创作者)。

注册路径:

  1. 访问 chatgpt.com,邮箱注册(中国大陆用户需海外手机号验证 + 网络环境)
  2. 升级到 Plus(支持信用卡、PayPal)
  3. 在新对话框右下角看到 「Create image」 按钮——这就是 Images 2.0 入口

常见踩坑:很多人以为「DALL-E」按钮就是 Images 2.0。错。起,老 DALL-E 3 已下线,「Create image」按钮直接调用 chatgpt-images-2.0 模型。

二、界面巡礼:四个核心控件

四个核心控件:

  1. 📎 附件——上传参考图(最多 4 张)。Images 2.0 是多模态模型,参考图比 100 字描述更有效
  2. 🌍 联网——开启后模型可搜索最新信息(如「画 最火的 AI 工具 logo 拼图」)
  3. 🧠 思考模式——开启后模型会先「想」再画,复杂任务必开(详见第 06 章)
  4. ⚙️ 工具——选择 Images 2.0、Code Interpreter、Browse 等

新手最佳起点:联网关、思考开、不传附件、直接打字。

三、第一句话:为什么「画一只猫」不是好提示词

99% 的新手第一句话都是这种风格:

「画一只猫」 「来一张科幻飞船」 「给我一个 logo」

这些提示词的问题不是「短」,是**「歧义」**。AI 不知道:

  • 猫是什么品种?什么动作?什么场景?什么风格?
  • 飞船是赛博朋克还是太空歌剧?硬科幻还是软科幻?
  • Logo 用在哪里?什么行业?什么调性?

模型会给你一个**「最大众期待」的中庸答案**——通常是橘猫蹲在地板上、灰色金属飞船、蓝绿色无衬线字 logo。

正确的「第一句话」应该至少包含主体 + 场景 + 风格三要素:

❌「画一只猫」 ✅「一只橘色长毛波斯猫坐在北欧风窗台上晨光透过纱帘水彩插画风格

差异立现。

四、三段式起手:最小可用框架

完整的七维公式留到第 03 章细讲。本章先给你三段式起手模板,30 分钟出图够用:

[主体描述],[场景与光线],[风格与质感]

举三个例子:

1. 桌面壁纸

一只橘色长毛波斯猫蜷成圆球熟睡,深木色书房窗台,午后斜阳从右侧斜入,暖黄色调,写实摄影风格,浅景深虚化背景

2. 公众号封面

标题文字「认知的觉醒」放在画面中央,背景是日出时分山顶云海,简洁现代海报风格,2:1 横向构图,留白适中

3. Logo 草稿

一个咖啡品牌的 Logo,融合咖啡豆和书本的元素,扁平化设计,大地色系,简洁现代风

把这三句话依次发给 ChatGPT,你会在 15-30 秒内得到三张图。

五、看图说话:用一句话改图

拿到第一张图,90% 的人会立刻接受立刻放弃重写。这是新手最大错误。

正确做法:用「微调指令」继续对话。Images 2.0 是「对话式出图」,模型会记住前文 + 上一张图,做精准修改。

10 个高频改图指令:

  1. 把背景换成蓝色调」
  2. 主体放大 30%」
  3. 加一些 散落的樱花花瓣」
  4. 去掉 右上角的杯子」
  5. 改成正方形 比例(1:1)」
  6. 风格更偏向 Studio Ghibli」
  7. 色调更暖,像日落时分」
  8. 重画一张,保持构图不变」
  9. 变成 4 张不同角度的尝试」
  10. 人物的表情 更柔和一些」

记住:改图不是重新提示词,是给已有的图加修改指令。这是 Images 2.0 与 Mid 最大的工作流差异。

六、保存与分享:版权与可商用

出完图,三件事要做对:

6.1 下载原图

右键图 → 另存为 → 默认 PNG 格式。不要截图——会损失分辨率与色彩深度。

6.2 版权与商用

OpenAI 条款(截至本书写作):

  • 个人订阅:商用允许(自媒体、电商、设计交付均可)
  • API:商用允许
  • 限制:不得用于深伪、误导性新闻、违法用途
  • 风险点:含真人面孔、知名 IP、商标的图——即使模型生成成功,商用仍可能侵权

安全做法

  1. 商用前用 Google 反向图搜验证「无明显复刻」
  2. 涉及真人/IP/商标的不商用
  3. 重要交付保留提示词记录(万一被维权可证明非剽窃)

6.3 提示词归档

这是 90% 新手不做、但应该做的事:每张满意图的提示词存进 Notion / Excel。

  • 因为你 1 个月后再也想不起当时怎么写的
  • 因为你的提示词资产是你最大的复利

七、新手 30 分钟翻车点速查

8 个最常见翻车 + 解药:

  1. 内容政策红线:色情、暴力、政治敏感、知名真人脸——直接拒绝出图,换主题
  2. 比例错误:默认 1:1,要竖图请明说「9:16」「2:3」「3:4」
  3. 文字乱码:长句子文字仍可能错,用「英文短词」或「中文 4 字内」最稳
  4. 手指畸形:v2 大幅改善但仍偶发,可加「双手清晰自然」提示,或用第 09 章局部修
  5. 风格混乱:一句话指定 3 个以上风格 → 模型崩溃,最多 2 个风格 + 「融合」
  6. 背景过于复杂:主体被淹没,明确加「简洁背景 / 浅景深虚化」
  7. 模糊不清:错以为加「8K 超高清」有用 → 删掉,改成提示「细节清晰」
  8. 改图改坏了:一次只改一个点,连续改 5+ 次会越改越乱 → 回到第 1 张原图重新改

实操任务(30 分钟)

完成 3 个任务,做完才进入第 03 章

任务 1:桌面壁纸(10 分钟)

用第 04 节的「三段式起手」写出你的桌面壁纸提示词,要求:

  • 你真心喜欢的主题
  • 16:9 比例(明示比例)
  • 改 2 次(一次改色调、一次改细节)

任务 2:公众号封面(10 分钟)

为你假想的一篇文章「2026 年我的视觉觉醒」做封面:

  • 含中文标题
  • 2:1 横向比例
  • 适合朋友圈分享的现代风

任务 3:风格对比(10 分钟)

同一个主体(自定),用 3 种不同风格各出一张,比较差异:

  • 写实摄影
  • Studio Ghibli 动画
  • 极简水彩插画

把 3 张图 + 提示词存档,作为你的「第一份提示词资产」。

你将带走

  • 首次出图 5 分钟清单(账号 → 套餐 → 入口 → 三段式 → 改图)
  • 新手 8 大踩坑速查卡(本章 §7)
  • 3 张提示词归档(你自己的第一份资产)

阅读时间

约 25 分钟阅读 + 15-30 分钟实操。

完成实操后,进入第 03 章——七维公式让你的合格率从 30% 跳到 80%。