第 02 章 30 分钟从零到第一张满意图

「最难的不是出第一张图，是出第一张『让自己满意』的图。」

本章导读

如果你从未用过 ChatGPT 出图，本章是你的快速通道。30 分钟，三个小目标：

登入账号 → 找到 Images 2.0 入口（5 分钟）
发出第一张「能用」的图（10 分钟）
通过对话把它改到「满意」（15 分钟）

如果你已经用过 DALL-E 3 或 Midjourney——别跳过本章。Images 2.0 的工作流和你想象的不一样：它不只是一个出图按钮，是一个会思考、会改图、会跟你来回沟通的设计师助理。用旧习惯写新工具的提示词，会浪费它 70% 的能力。

一、账号准备：哪个套餐能用 Images 2.0

的官方政策：

套餐	月费	Images 2.0 配额	思考模式	API 访问
Free	$0	每日 3 张（低优先级）	❌	❌
Plus	$20	每 3 小时 ~50 张	✅	❌
Pro	$200	几乎无限 + 优先	✅	✅
Team	$30/人	与 Plus 相当	✅	❌
Enterprise	商谈	自定义	✅	✅

强烈推荐 Plus 起步。Free 配额太低，不足以完成本书的练习；Pro 适合每天出图 > 50 张的重度用户（电商卖家、AIGC 全职创作者）。

注册路径：

访问 chatgpt.com，邮箱注册（中国大陆用户需海外手机号验证 + 网络环境）
升级到 Plus（支持信用卡、PayPal）
在新对话框右下角看到 「Create image」 按钮——这就是 Images 2.0 入口

常见踩坑：很多人以为「DALL-E」按钮就是 Images 2.0。错。起，老 DALL-E 3 已下线，「Create image」按钮直接调用 chatgpt-images-2.0 模型。

二、界面巡礼：四个核心控件

四个核心控件：

📎 附件——上传参考图（最多 4 张）。Images 2.0 是多模态模型，参考图比 100 字描述更有效
🌍 联网——开启后模型可搜索最新信息（如「画最火的 AI 工具 logo 拼图」）
🧠 思考模式——开启后模型会先「想」再画，复杂任务必开（详见第 06 章）
⚙️ 工具——选择 Images 2.0、Code Interpreter、Browse 等

新手最佳起点：联网关、思考开、不传附件、直接打字。

三、第一句话：为什么「画一只猫」不是好提示词

99% 的新手第一句话都是这种风格：

「画一只猫」「来一张科幻飞船」「给我一个 logo」

这些提示词的问题不是「短」，是**「歧义」**。AI 不知道：

猫是什么品种？什么动作？什么场景？什么风格？
飞船是赛博朋克还是太空歌剧？硬科幻还是软科幻？
Logo 用在哪里？什么行业？什么调性？

模型会给你一个**「最大众期待」的中庸答案**——通常是橘猫蹲在地板上、灰色金属飞船、蓝绿色无衬线字 logo。

正确的「第一句话」应该至少包含主体 + 场景 + 风格三要素：

❌「画一只猫」 ✅「一只橘色长毛波斯猫坐在北欧风窗台上，晨光透过纱帘，水彩插画风格」

差异立现。

四、三段式起手：最小可用框架

完整的七维公式留到第 03 章细讲。本章先给你三段式起手模板，30 分钟出图够用：

[主体描述]，[场景与光线]，[风格与质感]

举三个例子：

1. 桌面壁纸

一只橘色长毛波斯猫蜷成圆球熟睡，深木色书房窗台，午后斜阳从右侧斜入，暖黄色调，写实摄影风格，浅景深虚化背景

2. 公众号封面

标题文字「认知的觉醒」放在画面中央，背景是日出时分山顶云海，简洁现代海报风格，2:1 横向构图，留白适中

3. Logo 草稿

一个咖啡品牌的 Logo，融合咖啡豆和书本的元素，扁平化设计，大地色系，简洁现代风

把这三句话依次发给 ChatGPT，你会在 15-30 秒内得到三张图。

五、看图说话：用一句话改图

拿到第一张图，90% 的人会立刻接受或立刻放弃重写。这是新手最大错误。

正确做法：用「微调指令」继续对话。Images 2.0 是「对话式出图」，模型会记住前文 + 上一张图，做精准修改。

10 个高频改图指令：

「把背景换成蓝色调」
「主体放大 30%」
「加一些 散落的樱花花瓣」
「去掉右上角的杯子」
「改成正方形 比例（1:1）」
「风格更偏向 Studio Ghibli」
「色调更暖，像日落时分」
「重画一张，保持构图不变」
「变成 4 张不同角度的尝试」
「人物的表情 更柔和一些」

记住：改图不是重新提示词，是给已有的图加修改指令。这是 Images 2.0 与 Mid 最大的工作流差异。

六、保存与分享：版权与可商用

出完图，三件事要做对：

6.1 下载原图

右键图 → 另存为 → 默认 PNG 格式。不要截图——会损失分辨率与色彩深度。

6.2 版权与商用

OpenAI 条款（截至本书写作）：

个人订阅：商用允许（自媒体、电商、设计交付均可）
API：商用允许
限制：不得用于深伪、误导性新闻、违法用途
风险点：含真人面孔、知名 IP、商标的图——即使模型生成成功，商用仍可能侵权

安全做法：

商用前用 Google 反向图搜验证「无明显复刻」
涉及真人/IP/商标的不商用
重要交付保留提示词记录（万一被维权可证明非剽窃）

6.3 提示词归档

这是 90% 新手不做、但应该做的事：每张满意图的提示词存进 Notion / Excel。

因为你 1 个月后再也想不起当时怎么写的
因为你的提示词资产是你最大的复利

七、新手 30 分钟翻车点速查

8 个最常见翻车 + 解药：

内容政策红线：色情、暴力、政治敏感、知名真人脸——直接拒绝出图，换主题
比例错误：默认 1:1，要竖图请明说「9:16」「2:3」「3:4」
文字乱码：长句子文字仍可能错，用「英文短词」或「中文 4 字内」最稳
手指畸形：v2 大幅改善但仍偶发，可加「双手清晰自然」提示，或用第 09 章局部修
风格混乱：一句话指定 3 个以上风格 → 模型崩溃，最多 2 个风格 + 「融合」
背景过于复杂：主体被淹没，明确加「简洁背景 / 浅景深虚化」
模糊不清：错以为加「8K 超高清」有用 → 删掉，改成提示「细节清晰」
改图改坏了：一次只改一个点，连续改 5+ 次会越改越乱 → 回到第 1 张原图重新改

实操任务（30 分钟）

完成 3 个任务，做完才进入第 03 章：

任务 1：桌面壁纸（10 分钟）

用第 04 节的「三段式起手」写出你的桌面壁纸提示词，要求：

你真心喜欢的主题
16:9 比例（明示比例）
改 2 次（一次改色调、一次改细节）

任务 2：公众号封面（10 分钟）

为你假想的一篇文章「2026 年我的视觉觉醒」做封面：

含中文标题
2:1 横向比例
适合朋友圈分享的现代风

任务 3：风格对比（10 分钟）

同一个主体（自定），用 3 种不同风格各出一张，比较差异：

写实摄影
Studio Ghibli 动画
极简水彩插画

把 3 张图 + 提示词存档，作为你的「第一份提示词资产」。

你将带走

首次出图 5 分钟清单（账号 → 套餐 → 入口 → 三段式 → 改图）
新手 8 大踩坑速查卡（本章 §7）
3 张提示词归档（你自己的第一份资产）

阅读时间

约 25 分钟阅读 + 15-30 分钟实操。

完成实操后，进入第 03 章——七维公式让你的合格率从 30% 跳到 80%。