第 02 章 30 分钟从零到第一张满意图
第 02 章 30 分钟从零到第一张满意图
「最难的不是出第一张图,是出第一张『让自己满意』的图。」
本章导读
如果你从未用过 ChatGPT 出图,本章是你的快速通道。30 分钟,三个小目标:
- 登入账号 → 找到 Images 2.0 入口(5 分钟)
- 发出第一张「能用」的图(10 分钟)
- 通过对话把它改到「满意」(15 分钟)
如果你已经用过 DALL-E 3 或 Midjourney——别跳过本章。Images 2.0 的工作流和你想象的不一样:它不只是一个出图按钮,是一个会思考、会改图、会跟你来回沟通的设计师助理。用旧习惯写新工具的提示词,会浪费它 70% 的能力。
一、账号准备:哪个套餐能用 Images 2.0
的官方政策:
| 套餐 | 月费 | Images 2.0 配额 | 思考模式 | API 访问 |
|---|---|---|---|---|
| Free | $0 | 每日 3 张(低优先级) | ❌ | ❌ |
| Plus | $20 | 每 3 小时 ~50 张 | ✅ | ❌ |
| Pro | $200 | 几乎无限 + 优先 | ✅ | ✅ |
| Team | $30/人 | 与 Plus 相当 | ✅ | ❌ |
| Enterprise | 商谈 | 自定义 | ✅ | ✅ |
强烈推荐 Plus 起步。Free 配额太低,不足以完成本书的练习;Pro 适合每天出图 > 50 张的重度用户(电商卖家、AIGC 全职创作者)。
注册路径:
- 访问 chatgpt.com,邮箱注册(中国大陆用户需海外手机号验证 + 网络环境)
- 升级到 Plus(支持信用卡、PayPal)
- 在新对话框右下角看到 「Create image」 按钮——这就是 Images 2.0 入口
常见踩坑:很多人以为「DALL-E」按钮就是 Images 2.0。错。起,老 DALL-E 3 已下线,「Create image」按钮直接调用
chatgpt-images-2.0模型。
二、界面巡礼:四个核心控件
四个核心控件:
- 📎 附件——上传参考图(最多 4 张)。Images 2.0 是多模态模型,参考图比 100 字描述更有效
- 🌍 联网——开启后模型可搜索最新信息(如「画 最火的 AI 工具 logo 拼图」)
- 🧠 思考模式——开启后模型会先「想」再画,复杂任务必开(详见第 06 章)
- ⚙️ 工具——选择 Images 2.0、Code Interpreter、Browse 等
新手最佳起点:联网关、思考开、不传附件、直接打字。
三、第一句话:为什么「画一只猫」不是好提示词
99% 的新手第一句话都是这种风格:
「画一只猫」 「来一张科幻飞船」 「给我一个 logo」
这些提示词的问题不是「短」,是**「歧义」**。AI 不知道:
- 猫是什么品种?什么动作?什么场景?什么风格?
- 飞船是赛博朋克还是太空歌剧?硬科幻还是软科幻?
- Logo 用在哪里?什么行业?什么调性?
模型会给你一个**「最大众期待」的中庸答案**——通常是橘猫蹲在地板上、灰色金属飞船、蓝绿色无衬线字 logo。
正确的「第一句话」应该至少包含主体 + 场景 + 风格三要素:
❌「画一只猫」 ✅「一只橘色长毛波斯猫坐在北欧风窗台上,晨光透过纱帘,水彩插画风格」
差异立现。
四、三段式起手:最小可用框架
完整的七维公式留到第 03 章细讲。本章先给你三段式起手模板,30 分钟出图够用:
[主体描述],[场景与光线],[风格与质感]
举三个例子:
1. 桌面壁纸
一只橘色长毛波斯猫蜷成圆球熟睡,深木色书房窗台,午后斜阳从右侧斜入,暖黄色调,写实摄影风格,浅景深虚化背景
2. 公众号封面
标题文字「认知的觉醒」放在画面中央,背景是日出时分山顶云海,简洁现代海报风格,2:1 横向构图,留白适中
3. Logo 草稿
一个咖啡品牌的 Logo,融合咖啡豆和书本的元素,扁平化设计,大地色系,简洁现代风
把这三句话依次发给 ChatGPT,你会在 15-30 秒内得到三张图。
五、看图说话:用一句话改图
拿到第一张图,90% 的人会立刻接受或立刻放弃重写。这是新手最大错误。
正确做法:用「微调指令」继续对话。Images 2.0 是「对话式出图」,模型会记住前文 + 上一张图,做精准修改。
10 个高频改图指令:
- 「把背景换成蓝色调」
- 「主体放大 30%」
- 「加一些 散落的樱花花瓣」
- 「去掉 右上角的杯子」
- 「改成正方形 比例(1:1)」
- 「风格更偏向 Studio Ghibli」
- 「色调更暖,像日落时分」
- 「重画一张,保持构图不变」
- 「变成 4 张不同角度的尝试」
- 「人物的表情 更柔和一些」
记住:改图不是重新提示词,是给已有的图加修改指令。这是 Images 2.0 与 Mid 最大的工作流差异。
六、保存与分享:版权与可商用
出完图,三件事要做对:
6.1 下载原图
右键图 → 另存为 → 默认 PNG 格式。不要截图——会损失分辨率与色彩深度。
6.2 版权与商用
OpenAI 条款(截至本书写作):
- 个人订阅:商用允许(自媒体、电商、设计交付均可)
- API:商用允许
- 限制:不得用于深伪、误导性新闻、违法用途
- 风险点:含真人面孔、知名 IP、商标的图——即使模型生成成功,商用仍可能侵权
安全做法:
- 商用前用 Google 反向图搜验证「无明显复刻」
- 涉及真人/IP/商标的不商用
- 重要交付保留提示词记录(万一被维权可证明非剽窃)
6.3 提示词归档
这是 90% 新手不做、但应该做的事:每张满意图的提示词存进 Notion / Excel。
- 因为你 1 个月后再也想不起当时怎么写的
- 因为你的提示词资产是你最大的复利
七、新手 30 分钟翻车点速查
8 个最常见翻车 + 解药:
- 内容政策红线:色情、暴力、政治敏感、知名真人脸——直接拒绝出图,换主题
- 比例错误:默认 1:1,要竖图请明说「9:16」「2:3」「3:4」
- 文字乱码:长句子文字仍可能错,用「英文短词」或「中文 4 字内」最稳
- 手指畸形:v2 大幅改善但仍偶发,可加「双手清晰自然」提示,或用第 09 章局部修
- 风格混乱:一句话指定 3 个以上风格 → 模型崩溃,最多 2 个风格 + 「融合」
- 背景过于复杂:主体被淹没,明确加「简洁背景 / 浅景深虚化」
- 模糊不清:错以为加「8K 超高清」有用 → 删掉,改成提示「细节清晰」
- 改图改坏了:一次只改一个点,连续改 5+ 次会越改越乱 → 回到第 1 张原图重新改
实操任务(30 分钟)
完成 3 个任务,做完才进入第 03 章:
任务 1:桌面壁纸(10 分钟)
用第 04 节的「三段式起手」写出你的桌面壁纸提示词,要求:
- 你真心喜欢的主题
- 16:9 比例(明示比例)
- 改 2 次(一次改色调、一次改细节)
任务 2:公众号封面(10 分钟)
为你假想的一篇文章「2026 年我的视觉觉醒」做封面:
- 含中文标题
- 2:1 横向比例
- 适合朋友圈分享的现代风
任务 3:风格对比(10 分钟)
同一个主体(自定),用 3 种不同风格各出一张,比较差异:
- 写实摄影
- Studio Ghibli 动画
- 极简水彩插画
把 3 张图 + 提示词存档,作为你的「第一份提示词资产」。
你将带走
- 首次出图 5 分钟清单(账号 → 套餐 → 入口 → 三段式 → 改图)
- 新手 8 大踩坑速查卡(本章 §7)
- 3 张提示词归档(你自己的第一份资产)
阅读时间
约 25 分钟阅读 + 15-30 分钟实操。
完成实操后,进入第 03 章——七维公式让你的合格率从 30% 跳到 80%。