第01课提示词的底层逻辑

本课目标

理解大语言模型如何"读懂"你的提示词，掌握Token、注意力机制、上下文窗口等核心概念，为后续所有高级技术打下坚实基础。

一、为什么提示词如此重要

1.1 AI时代的"编程语言"

传统编程用代码与计算机对话，AI时代用自然语言与模型对话。提示词就是这个时代最重要的"编程语言"。

一个事实：

同一个模型，不同的提示词，输出质量可以相差 10倍以上
顶级Prompt Engineer年薪可达 $300K+（数据来源：Anthropic、OpenAI招聘）
全球Prompt交易市场规模预计2026年突破 $5亿

1.2 提示词工程 vs 随便问问

维度	随便问问	提示词工程
输入	“帮我写篇文章”	结构化指令+角色+约束+示例
输出质量	泛泛而谈，需多次修改	一次命中，专业水准
效率	反复来回3-5次	1-2次完成
可复用性	每次重新想	模板化、可迭代
变现能力	无	可卖模板、接单、做课程

1.3 Prompt Engineer的技能图谱

提示词工程师能力模型
├── 基础层：语言表达 + 逻辑思维
├── 技术层：LLM原理 + Prompt框架 + 调优
├── 应用层：垂直场景 + 多模态 + API
├── 商业层：变现路径 + 个人品牌 + 定价
└── 进化层：持续学习 + 社区 + 前沿追踪

二、大语言模型的工作原理

2.1 什么是LLM

大语言模型（Large Language Model）的核心是下一个Token预测：

输入序列: "今天天气真"
模型预测: "好" (概率 0.45) / "不错" (概率 0.32) / "差" (概率 0.08)

关键理解：

模型不"理解"含义，它在做统计概率预测
但海量数据训练后，这种预测呈现出"智能"的效果
你的提示词本质上是在引导概率分布

2.2 Token：AI的"字母表"

Token是模型处理文本的最小单元：

语言	文本	Token数	说明
英文	“Hello world”	2	每个单词≈1 Token
英文	“unbelievable”	3	长词会被拆分
中文	“你好世界”	4	每个字≈1-2 Token
中文	“人工智能”	3	常见词可能合并
代码	`print("hi")`	5	符号单独计Token

Token经济学：

GPT-4o: 输入 $2.50/百万Token，输出 $10/百万Token
Claude Opus 4 Sonnet: 输入 $3/百万Token，输出 $15/百万Token
1百万Token ≈ 75万个英文单词 ≈ 50万个中文字

实操：Token计数工具

工具1: https://platform.openai.com/tokenizer（OpenAI官方）
工具2: tiktoken库（Python）
工具3: 经验法则 —— 中文1字≈1.5Token，英文1词≈1.3Token

2.3 注意力机制：模型如何"看"你的提示词

Transformer的自注意力机制决定了模型如何分配关注度：

提示词: "作为一位资深Python开发者，请用面向对象的方式实现一个待办事项管理系统"

注意力分配（简化示意）:
"资深Python开发者" → 高权重（角色定义）
"面向对象" → 高权重（技术约束）
"待办事项管理系统" → 最高权重（核心任务）
"作为一位" → 低权重（功能词）
"请用...的方式" → 中权重（方式约束）

对你的启示：

关键信息前置 — 模型对开头和结尾的注意力更强
用精确词汇 — 减少歧义，让注意力集中到正确目标
结构化格式 — 帮助模型区分不同信息的层级

2.4 上下文窗口：模型的"工作记忆"

模型	上下文窗口	约等于
GPT-4o	128K tokens	一本30万字的书
Claude Opus 4	200K tokens	一本50万字的书
Gemini 1.5 Pro	2M tokens	10本书
GPT-4o-mini	16K tokens	一篇长论文

关键认知：

上下文窗口 = 输入 + 输出 的Token总量
窗口越大越好？不一定 — 中间信息容易被"遗忘"（Lost in the Middle现象）
最佳实践：把最重要的指令放在开头和结尾

2.5 Temperature与采样：控制AI的"创造力"

Temperature	效果	适用场景
0	完全确定性，每次输出一样	数据提取、分类、代码
0.3	低随机性，稳定可预测	商务写作、报告
0.7	中等随机性，平衡创意	通用写作、对话
1.0	高随机性，充满创意	头脑风暴、创意写作
1.5+	极高随机性，可能胡说	一般不推荐

三、提示词的基本结构

3.1 最简提示词模型

指令（Instruction）: 告诉AI做什么
    ↓
上下文（Context）: 提供背景信息
    ↓
输入数据（Input）: 需要处理的内容
    ↓
输出格式（Output Format）: 指定输出形式

3.2 四要素实战对比

❌ 差的提示词：

帮我分析一下这个数据

✅ 好的提示词：

【指令】请对以下电商销售数据进行分析，找出3个关键趋势和2个改进建议。

【上下文】这是一家主营女装的淘宝店铺，运营6个月，月均GMV 15万。

【输入数据】
- 1月: GMV 8万，退货率 22%，复购率 5%
- 2月: GMV 10万，退货率 20%，复购率 8%
- 3月: GMV 15万，退货率 18%，复购率 12%
- 4月: GMV 13万，退货率 25%，复购率 10%
- 5月: GMV 18万，退货率 15%，复购率 15%
- 6月: GMV 20万，退货率 16%，复购率 18%

【输出格式】
使用以下结构：
1. 数据概览（3行总结）
2. 关键趋势（每条趋势含数据支撑）
3. 改进建议（含预期效果）

3.3 提示词长度的黄金法则

简单任务: 1-3行（翻译、改写、简单问答）
中等任务: 5-15行（分析、写作、策划）
复杂任务: 20-50行（系统设计、完整方案）
超级任务: 50+行（含示例、多步骤、严格约束）

⚠️ 注意：不是越长越好！冗余信息会降低输出质量

四、提示词的六大黄金原则

原则一：明确具体（Be Specific）

模糊 ❌	明确 ✅
写篇文章	写一篇800字的小红书种草文，产品是XX面霜，针对25-35岁干皮女性
帮我改代码	将这个Python函数从同步改为异步（async/await），保持API兼容
总结一下	用3个要点总结这篇论文的核心发现，每点不超过50字

原则二：提供示例（Show, Don’t Tell）

请按以下格式生成产品描述：

【示例】
产品：蓝牙耳机
标题：🎧 静享好声音 | XX蓝牙耳机，降噪黑科技
卖点：① 40dB主动降噪 ② 30小时续航 ③ IP67防水
文案：在喧嚣的城市中，给耳朵一个安静的角落...

【现在请生成】
产品：智能手表

原则三：分步拆解（Step by Step）

请分步完成以下任务：
Step 1: 阅读下方用户评论，提取所有提到的产品问题
Step 2: 将问题按严重程度分为P0/P1/P2三级
Step 3: 针对每个P0问题，给出优化建议
Step 4: 用表格形式输出最终结果

原则四：设定角色（Role Playing）

你是一位拥有15年经验的品牌策划总监，曾服务过Nike、Apple等国际品牌。
你的沟通风格简洁有力，善于用数据说话，擅长抓住消费者心理。
请为以下新品牌制定上市策略...

原则五：限定边界（Set Constraints）

请回答以下问题，但需遵守以下约束：
- 只使用2026年之后的数据
- 不使用专业术语，用大白话解释
- 回答控制在500字以内
- 必须包含至少2个真实案例
- 不要使用"可能"、"大概"等模糊表达

原则六：迭代优化（Iterate & Refine）

第一版 → 审视输出 → 调整提示词 → 第二版 → ... → 满意版本

常见迭代动作：
✦ 增加约束（输出太泛时）
✦ 添加示例（格式不对时）
✦ 细化角色（风格不到位时）
✦ 拆解步骤（逻辑混乱时）
✦ 调整温度（创意/准确度不满时）

五、常见错误与避坑指南

5.1 十大常犯错误

#	错误	正确做法
1	一次塞太多任务	拆分为多个独立提示词
2	用否定句描述	用肯定句说明要什么
3	不指定输出格式	明确要表格/列表/JSON等
4	缺少上下文	提供必要背景信息
5	指令含糊不清	用精确、具体的描述
6	忽略模型局限	了解截止日期和能力边界
7	不检查输出	交叉验证重要信息
8	不做版本管理	记录每次修改和效果
9	忽略Temperature	根据任务类型调整
10	不迭代优化	至少迭代2-3次

5.2 否定句 vs 肯定句

❌ "不要写太长" → 模型不确定多长算"太长"
✅ "控制在300字以内" → 精确约束

❌ "不要用专业术语" → 模型可能仍然使用
✅ "用初中生能理解的语言" → 明确难度级别

❌ "不要列举太多" → 歧义
✅ "给出最重要的3个要点" → 精确数量

六、实战练习

练习1：将差提示词改为好提示词

原始提示词：

翻译这段话

优化方向：

指定源语言和目标语言
指定翻译风格（直译/意译/本地化）
指定受众和使用场景
指定专业术语处理方式

练习2：构建你的第一个结构化提示词

任务：为你的本职工作设计一个提示词，要求：
1. 包含四要素（指令/上下文/输入/输出格式）
2. 使用至少2个黄金原则
3. 实际运行并记录输出质量（1-10分）
4. 至少迭代优化1次

练习3：Token成本计算

场景：你需要用GPT-4o处理1000篇产品描述
- 每篇输入约500字（中文）
- 期望输出约300字
- 请计算总Token数和总费用

本课小结

概念	核心要点
提示词本质	引导模型的概率分布，是AI时代的"编程语言"
Token	模型处理的最小单元，影响成本和上下文容量
注意力机制	关键信息前置，精确词汇，结构化格式
上下文窗口	输入+输出总量限制，重要信息放首尾
Temperature	0=确定性，0.7=平衡，1.0=高创意
六大原则	明确具体、提供示例、分步拆解、设定角色、限定边界、迭代优化

📌 下节课预告：第02课将深入讲解CRISPE、CO-STAR等主流Prompt设计框架，教你用"公式"批量生产高质量提示词。

第01课 提示词的底层逻辑

第01课 提示词的底层逻辑

本课目标

一、为什么提示词如此重要

1.1 AI时代的"编程语言"

1.2 提示词工程 vs 随便问问

1.3 Prompt Engineer的技能图谱

二、大语言模型的工作原理

2.1 什么是LLM

2.2 Token：AI的"字母表"

2.3 注意力机制：模型如何"看"你的提示词

2.4 上下文窗口：模型的"工作记忆"

2.5 Temperature与采样：控制AI的"创造力"

三、提示词的基本结构

3.1 最简提示词模型

3.2 四要素实战对比

3.3 提示词长度的黄金法则

四、提示词的六大黄金原则

原则一：明确具体（Be Specific）

原则二：提供示例（Show, Don’t Tell）

原则三：分步拆解（Step by Step）

原则四：设定角色（Role Playing）

原则五：限定边界（Set Constraints）

原则六：迭代优化（Iterate & Refine）

五、常见错误与避坑指南

5.1 十大常犯错误

5.2 否定句 vs 肯定句

六、实战练习

练习1：将差提示词改为好提示词

练习2：构建你的第一个结构化提示词

练习3：Token成本计算

本课小结

第01课提示词的底层逻辑

第01课提示词的底层逻辑