第03课 高级提示词技术

第03课 高级提示词技术

本课目标

掌握思维链(CoT)、Few-shot、思维树(ToT)、自洽性(Self-Consistency)、ReAct等高级技术,让AI的推理能力和输出质量实现质的飞跃。


一、思维链 Chain-of-Thought(CoT)

1.1 什么是思维链

思维链是让AI展示推理过程而不是直接给答案的技术。

无CoT:

Q: 一个商店有35个苹果,卖了20个,又进了15个,最后有多少个?
A: 30个

有CoT:

Q: 一个商店有35个苹果,卖了20个,又进了15个,最后有多少个?
A: 让我一步步计算:
1. 初始苹果数:35个
2. 卖出后:35 - 20 = 15个
3. 进货后:15 + 15 = 30个
因此,最后有30个苹果。

1.2 CoT为什么有效

模型推理能力提升原理:

传统方式: 输入 → [黑箱] → 输出
CoT方式:  输入 → 步骤1 → 步骤2 → 步骤3 → 输出

关键:每一步的输出都成为下一步的"上下文"
相当于给模型更多的"工作记忆"来处理复杂问题

研究数据(Google Brain, 2022):

  • 数学推理:准确率提升 +40%
  • 常识推理:准确率提升 +25%
  • 符号推理:从 0% → 95%+

1.3 CoT三种触发方式

方式一:零样本CoT(最简单)

请解决以下问题,请一步一步思考。

[问题内容]

方式二:手动CoT(最精确)

请按以下步骤分析:
Step 1: 识别问题中的关键变量
Step 2: 列出已知条件
Step 3: 确定需要使用的公式/方法
Step 4: 逐步计算
Step 5: 验证结果的合理性

方式三:自动CoT(APE方法)

在解决这个问题之前,请先:
1. 重述你对问题的理解
2. 列出你的思考路径
3. 然后执行每一步
4. 最后检查答案

1.4 CoT实战场景

场景1:商业分析

请一步一步分析以下商业数据,做出投资建议:

数据:
- 公司A:营收增长30%,利润下降5%,员工增长50%
- 公司B:营收增长10%,利润增长20%,员工减少10%
- 公司C:营收下降5%,利润增长35%,员工不变

分析步骤:
1. 先分析每家公司的增长质量
2. 然后评估运营效率
3. 接着考虑人效比
4. 最后给出投资排序和理由

场景2:代码调试

请一步一步帮我调试这段代码:

Step 1: 阅读代码,理解预期功能
Step 2: 识别潜在的bug位置
Step 3: 解释每个bug的原因
Step 4: 给出修复方案
Step 5: 提供修复后的完整代码

[代码内容]

二、Few-shot Learning(少样本学习)

2.1 什么是Few-shot

通过提供几个示例来教会模型你要的输出格式和质量。

Few-shot光谱:

Zero-shot: 0个示例,纯指令
One-shot:  1个示例
Few-shot:  2-5个示例
Many-shot: 5+个示例(大上下文窗口时可用)

2.2 Few-shot模板

请按照以下示例的格式和风格完成任务:

【示例1】
输入:{示例输入1}
输出:{示例输出1}

【示例2】
输入:{示例输入2}
输出:{示例输出2}

【示例3】
输入:{示例输入3}
输出:{示例输出3}

---
现在请处理:
输入:{实际输入}
输出:

2.3 Few-shot实战案例

场景:产品评论情感分类

请对产品评论进行情感分析,参考以下示例:

【示例1】
评论:"这个耳机音质绝了,降噪效果好到爆!"
分析:情感=正面 | 关键词=音质绝, 降噪好 | 置信度=95%

【示例2】
评论:"质量一般,用了两周就坏了,客服态度还差。"
分析:情感=负面 | 关键词=质量一般, 坏了, 态度差 | 置信度=90%

【示例3】
评论:"价格合理,功能够用,但包装简陋了点。"
分析:情感=中性偏正 | 关键词=价格合理, 够用, 包装简陋 | 置信度=80%

---
请分析以下评论:
评论:"第一天用感觉不错,但第三天开始出现卡顿,客服说是正常的。"
分析:

2.4 Few-shot的黄金法则

法则 说明
示例要多样 覆盖不同类型/边界情况
示例要一致 格式、长度、风格统一
示例要典型 选有代表性的案例
顺序有影响 最重要的示例放最后
3-5个最佳 太少不够学,太多浪费Token
含负面示例 告诉模型什么是"不要的"

2.5 负面示例的威力

请为运动品牌写广告语。

✅ 好的示例:
- "Just Do It" — 简洁有力,动词驱动
- "Impossible is Nothing" — 态度鲜明,突破界限

❌ 不好的示例(请避免):
- "我们的鞋子质量很好" — 太平淡,没记忆点
- "买XX牌,打折优惠多" — 价格导向,没品牌感

现在请为品牌"PULSE运动"写3条广告语:

三、思维树 Tree-of-Thought(ToT)

3.1 什么是思维树

思维树是CoT的升级版——不是走一条推理路径,而是同时探索多条路径,评估优劣后选最佳。

传统CoT:  A → B → C → D → 答案

ToT:      A → B1 → C1 → 评估 ✗
              B2 → C2 → 评估 ✓ → 继续
              B3 → C3 → 评估 △ → 备选

3.2 ToT标准模板

我需要解决以下问题:[问题描述]

请使用思维树方法:

第一步:头脑风暴
列出3-5个可能的解决思路,每个用一行描述。

第二步:评估
对每个思路从可行性、效果、成本三个维度打分(1-10)。

第三步:深入最佳路径
选择得分最高的思路,详细展开实施方案。

第四步:自我检查
审视方案是否有遗漏,是否可以吸收其他思路的优点。

第五步:最终方案
输出完整、优化后的方案。

3.3 ToT实战案例

场景:为一个餐饮品牌选择扩张策略

问题:一家在北京有5家店的火锅品牌(年利润500万),
想在2年内扩张到20家店,应该选择什么策略?

请用思维树方法分析:

【头脑风暴 - 列出所有路径】
路径A: 直营扩张
路径B: 加盟模式
路径C: 合伙人模式
路径D: 外卖/零售化先行
路径E: 区域深耕→再跨城

【评估 - 多维度打分】
每个路径评估:
- 资金需求(越低越好)
- 品控难度(越低越好)
- 扩张速度(越快越好)
- 利润率(越高越好)
- 风险等级(越低越好)

【深入 - 展开最佳路径】
详细展开得分最高的路径

【优化 - 吸收其他路径优点】
看能否混搭其他路径的优势

【输出 - 最终推荐方案】

四、自洽性 Self-Consistency

4.1 原理

让模型对同一问题生成多个答案,然后取多数一致的结果。

同一问题 → 回答1: A
          → 回答2: A  
          → 回答3: B
          → 回答4: A
          → 回答5: A

多数票: A (4/5) → 选A为最终答案

4.2 自洽性Prompt

请对以下问题进行3次独立分析,每次使用不同的思考角度:

问题:{问题内容}

【分析视角1:{角度A}】
推理过程:...
结论:...

【分析视角2:{角度B}】
推理过程:...
结论:...

【分析视角3:{角度C}】
推理过程:...
结论:...

【综合判断】
3次分析的结论是否一致?如果一致,给出最终答案。
如果不一致,分析分歧原因,给出加权判断。

4.3 适合自洽性的场景

场景 说明
事实判断 多角度验证一个说法是否正确
数学计算 多种方法求解同一问题
代码审查 从安全/性能/可读性多角度审查
决策分析 从不同利益方角度评估
文档校对 不同轮次检查不同类型错误

五、ReAct框架(推理+行动)

5.1 什么是ReAct

ReAct = Reasoning(推理)+ Action(行动),让AI在推理的同时决定需要执行什么操作。

思考 → 行动 → 观察 → 思考 → 行动 → 观察 → ... → 最终答案

Thought 1: 我需要知道某公司的最新营收数据
Action 1: 搜索"XX公司 2026 Q4 财报"
Observation 1: 搜索结果显示营收为120亿...
Thought 2: 现在我需要对比去年同期...
Action 2: 搜索"XX公司 2026 Q4 财报"
...

5.2 ReAct模板

请使用推理-行动循环来解决以下问题:

问题:{问题描述}

请按以下格式思考和行动:

Thought 1: [你的推理过程]
Action 1: [你决定执行的操作,如搜索、计算、引用]
Observation 1: [操作的结果]

Thought 2: [基于观察的进一步推理]
Action 2: [下一步操作]
Observation 2: [结果]

...

Final Answer: [综合所有推理和观察的最终答案]

5.3 ReAct实战:竞品分析

请用ReAct方法分析我的竞品情况:

我的产品:一款AI写作助手,定价99元/月

请执行以下推理-行动循环:

Thought 1: 先识别主要竞品有哪些
Action 1: 列出AI写作助手赛道的主要玩家
Observation 1: [列出结果]

Thought 2: 分析各竞品的定价策略
Action 2: 对比各产品的价格和功能
Observation 2: [对比表格]

Thought 3: 找出竞品的薄弱环节
Action 3: 分析用户对竞品的常见抱怨
Observation 3: [抱怨列表]

Thought 4: 制定差异化策略
Action 4: 基于以上分析提出差异化方向
Final Answer: [完整的竞品分析报告和应对策略]

六、元提示词 Meta-Prompting

6.1 让AI帮你写提示词

我需要完成以下任务:{简单描述你的任务}

请帮我设计一个高质量的提示词,要求:
1. 使用CO-STAR框架
2. 包含至少2个示例
3. 包含明确的输出格式
4. 包含约束条件
5. 考虑可能的边界情况

请直接输出可以复制使用的完整提示词。

6.2 提示词自我优化

以下是我当前使用的提示词:

"""
{你现有的提示词}
"""

这个提示词的输出经常存在以下问题:
1. {问题1}
2. {问题2}

请帮我优化这个提示词,要求:
- 保持原始意图不变
- 解决上述问题
- 给出优化后的版本和改动说明

七、技术对比与选择指南

技术 适用场景 效果提升 复杂度 Token消耗
Zero-shot CoT 简单推理 +15-25%
Manual CoT 多步推理 +25-40% ⭐⭐
Few-shot 格式统一 +30-50% ⭐⭐
ToT 复杂决策 +30-50% ⭐⭐⭐⭐
Self-Consistency 需高准确 +10-20% ⭐⭐⭐ 很高
ReAct 多步任务 +20-35% ⭐⭐⭐
Meta-Prompting 优化Prompt 间接提升 ⭐⭐

技术选择决策树

你的任务是什么?
├── 需要推理/计算 → CoT
│   └── 很复杂? → ToT
├── 需要统一格式 → Few-shot
├── 需要高准确度 → Self-Consistency
├── 需要多步操作 → ReAct
├── 需要写好的Prompt → Meta-Prompting
└── 简单任务 → Zero-shot即可

八、实战练习

练习1:CoT应用

用思维链方法解决:

一家公司有100名员工,每人月薪1万。
公司计划裁员20%,但给剩余员工加薪15%。
同时招聘10名实习生,月薪4000。

问:月人力成本变化了多少?

练习2:Few-shot + CoT组合

设计一个包含3个示例+思维链的提示词,用于:
"判断一个商业创意的可行性评分(1-100分)"

要求:每个示例都展示评分的推理过程

练习3:ToT实战

用思维树方法为以下问题设计3条路径并评估:

"一位自由职业者,月收入2万,想在1年内达到月入5万,
有哪些可行的路径?"

本课小结

技术 一句话总结
CoT 让AI展示推理过程,而非直接跳到答案
Few-shot 用示例教会AI你要的格式和质量
ToT 同时探索多条路径,择优深入
Self-Consistency 多次求解,取多数一致
ReAct 推理与行动交替,循环逼近答案
Meta-Prompting 让AI帮你设计和优化提示词

📌 下节课预告:第04课将构建你的垂直场景提示词库——写作、编程、营销、客服、教育等200+ 即用型模板。


© 2026 Angel Zhang & Charlie Cao · AI提示词工程实战课 · 版权所有