第03课:DALL-E 3与ChatGPT联合创作
第03课:DALL-E 3与ChatGPT联合创作
用中文对话,AI画出你脑中的画面
主讲:Angel Zhang & Charlie Cao
本节学习目标
- 掌握通过ChatGPT使用DALL-E 3的方法
- 学会用自然语言精确控制图片生成
- 掌握迭代修改和局部编辑技巧
- 了解DALL-E 3与Midjourney的差异和互补
一、DALL-E 3的独特优势
| 优势 | 说明 |
|---|---|
| 中文支持最好 | 完全可以用中文描述 |
| 对话式创作 | 像聊天一样修改图片 |
| 文字渲染好 | AI图片中的文字最准确 |
| 理解复杂场景 | 能准确理解包含多对象的描述 |
| 编辑功能 | 可以局部修改已生成的图片 |
二、基础使用
通过ChatGPT生成
直接在ChatGPT中说:
"帮我画一只穿着西装的橘猫,坐在办公桌前工作,
旁边有一杯咖啡,窗外是城市夜景,卡通风格"
ChatGPT会:
- 理解你的描述
- 自动优化为DALL-E Prompt
- 生成图片
- 你可以继续对话修改
三、精确控制技巧
控制构图
"画一张横版图片(16:9),
左边三分之一是一个人物,
右边三分之二是城市天际线"
控制风格
"用以下风格画:
- 扁平矢量插画风格
- 用蓝色和橙色为主色调
- 简洁线条,无多余装饰
- 类似Apple官网的设计风格"
控制细节
"修改上一张图:
- 把背景从白天改为夜晚
- 人物的衣服改为红色
- 添加一些飘落的樱花花瓣
- 其他保持不变"
四、DALL-E 3 vs Midjourney
| 维度 | DALL-E 3 | Midjourney |
|---|---|---|
| 操作方式 | 对话(最简单) | 命令/网页 |
| 画质上限 | 高 | 最高 |
| 中文理解 | 最好 | 一般 |
| 文字渲染 | 最好 | 较差 |
| 迭代修改 | 对话式修改 | 变体/重绘 |
| 价格 | ChatGPT Plus $20 | $10起 |
| 风格多样性 | 中等 | 极丰富 |
使用建议
- 需要精确控制/含文字 → DALL-E 3
- 追求最高画质/艺术感 → Midjourney
- 需要对话式迭代 → DALL-E 3
- 需要特定艺术风格 → Midjourney
五、实用场景模板
信息图/图解
"创建一张信息图,主题是'AI工具分类',
包含4个类别,每个类别用不同颜色的图标表示,
扁平设计风格,白色背景,蓝色调"
产品场景图
"一个白色的无线耳机放在大理石桌面上,
旁边有一杯拿铁和一本翻开的杂志,
窗边的自然光照射进来,
高端产品摄影风格,浅色调"
Logo概念
"设计一个极简Logo概念:
- 品牌名:EcoFlow
- 行业:可持续能源
- 风格:极简·现代
- 颜色:绿色+深灰
- 包含一个叶子和闪电的融合图形"
本课作业
- 用中文在ChatGPT中描述并生成3张不同风格的图片
- 选一张图,通过对话修改3次,逐步优化
- 用DALL-E 3生成一张包含文字的海报
下一课,我们学习免费无限的Stable Diffusion。