第03课:DALL-E 3与ChatGPT联合创作

第03课:DALL-E 3与ChatGPT联合创作

用中文对话,AI画出你脑中的画面

主讲:Angel Zhang & Charlie Cao


本节学习目标

  • 掌握通过ChatGPT使用DALL-E 3的方法
  • 学会用自然语言精确控制图片生成
  • 掌握迭代修改和局部编辑技巧
  • 了解DALL-E 3与Midjourney的差异和互补

一、DALL-E 3的独特优势

优势 说明
中文支持最好 完全可以用中文描述
对话式创作 像聊天一样修改图片
文字渲染好 AI图片中的文字最准确
理解复杂场景 能准确理解包含多对象的描述
编辑功能 可以局部修改已生成的图片

二、基础使用

通过ChatGPT生成

直接在ChatGPT中说:
"帮我画一只穿着西装的橘猫,坐在办公桌前工作,
旁边有一杯咖啡,窗外是城市夜景,卡通风格"

ChatGPT会:

  1. 理解你的描述
  2. 自动优化为DALL-E Prompt
  3. 生成图片
  4. 你可以继续对话修改

三、精确控制技巧

控制构图

"画一张横版图片(16:9),
左边三分之一是一个人物,
右边三分之二是城市天际线"

控制风格

"用以下风格画:
- 扁平矢量插画风格
- 用蓝色和橙色为主色调
- 简洁线条,无多余装饰
- 类似Apple官网的设计风格"

控制细节

"修改上一张图:
- 把背景从白天改为夜晚
- 人物的衣服改为红色
- 添加一些飘落的樱花花瓣
- 其他保持不变"

四、DALL-E 3 vs Midjourney

维度 DALL-E 3 Midjourney
操作方式 对话(最简单) 命令/网页
画质上限 最高
中文理解 最好 一般
文字渲染 最好 较差
迭代修改 对话式修改 变体/重绘
价格 ChatGPT Plus $20 $10起
风格多样性 中等 极丰富

使用建议

  • 需要精确控制/含文字 → DALL-E 3
  • 追求最高画质/艺术感 → Midjourney
  • 需要对话式迭代 → DALL-E 3
  • 需要特定艺术风格 → Midjourney

五、实用场景模板

信息图/图解

"创建一张信息图,主题是'AI工具分类',
包含4个类别,每个类别用不同颜色的图标表示,
扁平设计风格,白色背景,蓝色调"

产品场景图

"一个白色的无线耳机放在大理石桌面上,
旁边有一杯拿铁和一本翻开的杂志,
窗边的自然光照射进来,
高端产品摄影风格,浅色调"

Logo概念

"设计一个极简Logo概念:
- 品牌名:EcoFlow
- 行业:可持续能源
- 风格:极简·现代
- 颜色:绿色+深灰
- 包含一个叶子和闪电的融合图形"

本课作业

  1. 用中文在ChatGPT中描述并生成3张不同风格的图片
  2. 选一张图,通过对话修改3次,逐步优化
  3. 用DALL-E 3生成一张包含文字的海报

下一课,我们学习免费无限的Stable Diffusion。