第03课 高级提示词技术
第03课 高级提示词技术
本课目标
掌握思维链(CoT)、Few-shot、思维树(ToT)、自洽性(Self-Consistency)、ReAct等高级技术,让AI的推理能力和输出质量实现质的飞跃。
一、思维链 Chain-of-Thought(CoT)
1.1 什么是思维链
思维链是让AI展示推理过程而不是直接给答案的技术。
无CoT:
Q: 一个商店有35个苹果,卖了20个,又进了15个,最后有多少个?
A: 30个
有CoT:
Q: 一个商店有35个苹果,卖了20个,又进了15个,最后有多少个?
A: 让我一步步计算:
1. 初始苹果数:35个
2. 卖出后:35 - 20 = 15个
3. 进货后:15 + 15 = 30个
因此,最后有30个苹果。
1.2 CoT为什么有效
模型推理能力提升原理:
传统方式: 输入 → [黑箱] → 输出
CoT方式: 输入 → 步骤1 → 步骤2 → 步骤3 → 输出
关键:每一步的输出都成为下一步的"上下文"
相当于给模型更多的"工作记忆"来处理复杂问题
研究数据(Google Brain, 2022):
- 数学推理:准确率提升 +40%
- 常识推理:准确率提升 +25%
- 符号推理:从 0% → 95%+
1.3 CoT三种触发方式
方式一:零样本CoT(最简单)
请解决以下问题,请一步一步思考。
[问题内容]
方式二:手动CoT(最精确)
请按以下步骤分析:
Step 1: 识别问题中的关键变量
Step 2: 列出已知条件
Step 3: 确定需要使用的公式/方法
Step 4: 逐步计算
Step 5: 验证结果的合理性
方式三:自动CoT(APE方法)
在解决这个问题之前,请先:
1. 重述你对问题的理解
2. 列出你的思考路径
3. 然后执行每一步
4. 最后检查答案
1.4 CoT实战场景
场景1:商业分析
请一步一步分析以下商业数据,做出投资建议:
数据:
- 公司A:营收增长30%,利润下降5%,员工增长50%
- 公司B:营收增长10%,利润增长20%,员工减少10%
- 公司C:营收下降5%,利润增长35%,员工不变
分析步骤:
1. 先分析每家公司的增长质量
2. 然后评估运营效率
3. 接着考虑人效比
4. 最后给出投资排序和理由
场景2:代码调试
请一步一步帮我调试这段代码:
Step 1: 阅读代码,理解预期功能
Step 2: 识别潜在的bug位置
Step 3: 解释每个bug的原因
Step 4: 给出修复方案
Step 5: 提供修复后的完整代码
[代码内容]
二、Few-shot Learning(少样本学习)
2.1 什么是Few-shot
通过提供几个示例来教会模型你要的输出格式和质量。
Few-shot光谱:
Zero-shot: 0个示例,纯指令
One-shot: 1个示例
Few-shot: 2-5个示例
Many-shot: 5+个示例(大上下文窗口时可用)
2.2 Few-shot模板
请按照以下示例的格式和风格完成任务:
【示例1】
输入:{示例输入1}
输出:{示例输出1}
【示例2】
输入:{示例输入2}
输出:{示例输出2}
【示例3】
输入:{示例输入3}
输出:{示例输出3}
---
现在请处理:
输入:{实际输入}
输出:
2.3 Few-shot实战案例
场景:产品评论情感分类
请对产品评论进行情感分析,参考以下示例:
【示例1】
评论:"这个耳机音质绝了,降噪效果好到爆!"
分析:情感=正面 | 关键词=音质绝, 降噪好 | 置信度=95%
【示例2】
评论:"质量一般,用了两周就坏了,客服态度还差。"
分析:情感=负面 | 关键词=质量一般, 坏了, 态度差 | 置信度=90%
【示例3】
评论:"价格合理,功能够用,但包装简陋了点。"
分析:情感=中性偏正 | 关键词=价格合理, 够用, 包装简陋 | 置信度=80%
---
请分析以下评论:
评论:"第一天用感觉不错,但第三天开始出现卡顿,客服说是正常的。"
分析:
2.4 Few-shot的黄金法则
| 法则 | 说明 |
|---|---|
| 示例要多样 | 覆盖不同类型/边界情况 |
| 示例要一致 | 格式、长度、风格统一 |
| 示例要典型 | 选有代表性的案例 |
| 顺序有影响 | 最重要的示例放最后 |
| 3-5个最佳 | 太少不够学,太多浪费Token |
| 含负面示例 | 告诉模型什么是"不要的" |
2.5 负面示例的威力
请为运动品牌写广告语。
✅ 好的示例:
- "Just Do It" — 简洁有力,动词驱动
- "Impossible is Nothing" — 态度鲜明,突破界限
❌ 不好的示例(请避免):
- "我们的鞋子质量很好" — 太平淡,没记忆点
- "买XX牌,打折优惠多" — 价格导向,没品牌感
现在请为品牌"PULSE运动"写3条广告语:
三、思维树 Tree-of-Thought(ToT)
3.1 什么是思维树
思维树是CoT的升级版——不是走一条推理路径,而是同时探索多条路径,评估优劣后选最佳。
传统CoT: A → B → C → D → 答案
ToT: A → B1 → C1 → 评估 ✗
B2 → C2 → 评估 ✓ → 继续
B3 → C3 → 评估 △ → 备选
3.2 ToT标准模板
我需要解决以下问题:[问题描述]
请使用思维树方法:
第一步:头脑风暴
列出3-5个可能的解决思路,每个用一行描述。
第二步:评估
对每个思路从可行性、效果、成本三个维度打分(1-10)。
第三步:深入最佳路径
选择得分最高的思路,详细展开实施方案。
第四步:自我检查
审视方案是否有遗漏,是否可以吸收其他思路的优点。
第五步:最终方案
输出完整、优化后的方案。
3.3 ToT实战案例
场景:为一个餐饮品牌选择扩张策略
问题:一家在北京有5家店的火锅品牌(年利润500万),
想在2年内扩张到20家店,应该选择什么策略?
请用思维树方法分析:
【头脑风暴 - 列出所有路径】
路径A: 直营扩张
路径B: 加盟模式
路径C: 合伙人模式
路径D: 外卖/零售化先行
路径E: 区域深耕→再跨城
【评估 - 多维度打分】
每个路径评估:
- 资金需求(越低越好)
- 品控难度(越低越好)
- 扩张速度(越快越好)
- 利润率(越高越好)
- 风险等级(越低越好)
【深入 - 展开最佳路径】
详细展开得分最高的路径
【优化 - 吸收其他路径优点】
看能否混搭其他路径的优势
【输出 - 最终推荐方案】
四、自洽性 Self-Consistency
4.1 原理
让模型对同一问题生成多个答案,然后取多数一致的结果。
同一问题 → 回答1: A
→ 回答2: A
→ 回答3: B
→ 回答4: A
→ 回答5: A
多数票: A (4/5) → 选A为最终答案
4.2 自洽性Prompt
请对以下问题进行3次独立分析,每次使用不同的思考角度:
问题:{问题内容}
【分析视角1:{角度A}】
推理过程:...
结论:...
【分析视角2:{角度B}】
推理过程:...
结论:...
【分析视角3:{角度C}】
推理过程:...
结论:...
【综合判断】
3次分析的结论是否一致?如果一致,给出最终答案。
如果不一致,分析分歧原因,给出加权判断。
4.3 适合自洽性的场景
| 场景 | 说明 |
|---|---|
| 事实判断 | 多角度验证一个说法是否正确 |
| 数学计算 | 多种方法求解同一问题 |
| 代码审查 | 从安全/性能/可读性多角度审查 |
| 决策分析 | 从不同利益方角度评估 |
| 文档校对 | 不同轮次检查不同类型错误 |
五、ReAct框架(推理+行动)
5.1 什么是ReAct
ReAct = Reasoning(推理)+ Action(行动),让AI在推理的同时决定需要执行什么操作。
思考 → 行动 → 观察 → 思考 → 行动 → 观察 → ... → 最终答案
Thought 1: 我需要知道某公司的最新营收数据
Action 1: 搜索"XX公司 2026 Q4 财报"
Observation 1: 搜索结果显示营收为120亿...
Thought 2: 现在我需要对比去年同期...
Action 2: 搜索"XX公司 2026 Q4 财报"
...
5.2 ReAct模板
请使用推理-行动循环来解决以下问题:
问题:{问题描述}
请按以下格式思考和行动:
Thought 1: [你的推理过程]
Action 1: [你决定执行的操作,如搜索、计算、引用]
Observation 1: [操作的结果]
Thought 2: [基于观察的进一步推理]
Action 2: [下一步操作]
Observation 2: [结果]
...
Final Answer: [综合所有推理和观察的最终答案]
5.3 ReAct实战:竞品分析
请用ReAct方法分析我的竞品情况:
我的产品:一款AI写作助手,定价99元/月
请执行以下推理-行动循环:
Thought 1: 先识别主要竞品有哪些
Action 1: 列出AI写作助手赛道的主要玩家
Observation 1: [列出结果]
Thought 2: 分析各竞品的定价策略
Action 2: 对比各产品的价格和功能
Observation 2: [对比表格]
Thought 3: 找出竞品的薄弱环节
Action 3: 分析用户对竞品的常见抱怨
Observation 3: [抱怨列表]
Thought 4: 制定差异化策略
Action 4: 基于以上分析提出差异化方向
Final Answer: [完整的竞品分析报告和应对策略]
六、元提示词 Meta-Prompting
6.1 让AI帮你写提示词
我需要完成以下任务:{简单描述你的任务}
请帮我设计一个高质量的提示词,要求:
1. 使用CO-STAR框架
2. 包含至少2个示例
3. 包含明确的输出格式
4. 包含约束条件
5. 考虑可能的边界情况
请直接输出可以复制使用的完整提示词。
6.2 提示词自我优化
以下是我当前使用的提示词:
"""
{你现有的提示词}
"""
这个提示词的输出经常存在以下问题:
1. {问题1}
2. {问题2}
请帮我优化这个提示词,要求:
- 保持原始意图不变
- 解决上述问题
- 给出优化后的版本和改动说明
七、技术对比与选择指南
| 技术 | 适用场景 | 效果提升 | 复杂度 | Token消耗 |
|---|---|---|---|---|
| Zero-shot CoT | 简单推理 | +15-25% | ⭐ | 低 |
| Manual CoT | 多步推理 | +25-40% | ⭐⭐ | 中 |
| Few-shot | 格式统一 | +30-50% | ⭐⭐ | 中 |
| ToT | 复杂决策 | +30-50% | ⭐⭐⭐⭐ | 高 |
| Self-Consistency | 需高准确 | +10-20% | ⭐⭐⭐ | 很高 |
| ReAct | 多步任务 | +20-35% | ⭐⭐⭐ | 高 |
| Meta-Prompting | 优化Prompt | 间接提升 | ⭐⭐ | 中 |
技术选择决策树
你的任务是什么?
├── 需要推理/计算 → CoT
│ └── 很复杂? → ToT
├── 需要统一格式 → Few-shot
├── 需要高准确度 → Self-Consistency
├── 需要多步操作 → ReAct
├── 需要写好的Prompt → Meta-Prompting
└── 简单任务 → Zero-shot即可
八、实战练习
练习1:CoT应用
用思维链方法解决:
一家公司有100名员工,每人月薪1万。
公司计划裁员20%,但给剩余员工加薪15%。
同时招聘10名实习生,月薪4000。
问:月人力成本变化了多少?
练习2:Few-shot + CoT组合
设计一个包含3个示例+思维链的提示词,用于:
"判断一个商业创意的可行性评分(1-100分)"
要求:每个示例都展示评分的推理过程
练习3:ToT实战
用思维树方法为以下问题设计3条路径并评估:
"一位自由职业者,月收入2万,想在1年内达到月入5万,
有哪些可行的路径?"
本课小结
| 技术 | 一句话总结 |
|---|---|
| CoT | 让AI展示推理过程,而非直接跳到答案 |
| Few-shot | 用示例教会AI你要的格式和质量 |
| ToT | 同时探索多条路径,择优深入 |
| Self-Consistency | 多次求解,取多数一致 |
| ReAct | 推理与行动交替,循环逼近答案 |
| Meta-Prompting | 让AI帮你设计和优化提示词 |
📌 下节课预告:第04课将构建你的垂直场景提示词库——写作、编程、营销、客服、教育等200+ 即用型模板。
© 2026 Angel Zhang & Charlie Cao · AI提示词工程实战课 · 版权所有