第01课 提示词的底层逻辑
第01课 提示词的底层逻辑
本课目标
理解大语言模型如何"读懂"你的提示词,掌握Token、注意力机制、上下文窗口等核心概念,为后续所有高级技术打下坚实基础。
一、为什么提示词如此重要
1.1 AI时代的"编程语言"
传统编程用代码与计算机对话,AI时代用自然语言与模型对话。提示词就是这个时代最重要的"编程语言"。
一个事实:
- 同一个模型,不同的提示词,输出质量可以相差 10倍以上
- 顶级Prompt Engineer年薪可达 $300K+(数据来源:Anthropic、OpenAI招聘)
- 全球Prompt交易市场规模预计2026年突破 $5亿
1.2 提示词工程 vs 随便问问
| 维度 | 随便问问 | 提示词工程 |
|---|---|---|
| 输入 | “帮我写篇文章” | 结构化指令+角色+约束+示例 |
| 输出质量 | 泛泛而谈,需多次修改 | 一次命中,专业水准 |
| 效率 | 反复来回3-5次 | 1-2次完成 |
| 可复用性 | 每次重新想 | 模板化、可迭代 |
| 变现能力 | 无 | 可卖模板、接单、做课程 |
1.3 Prompt Engineer的技能图谱
提示词工程师能力模型
├── 基础层:语言表达 + 逻辑思维
├── 技术层:LLM原理 + Prompt框架 + 调优
├── 应用层:垂直场景 + 多模态 + API
├── 商业层:变现路径 + 个人品牌 + 定价
└── 进化层:持续学习 + 社区 + 前沿追踪
二、大语言模型的工作原理
2.1 什么是LLM
大语言模型(Large Language Model)的核心是下一个Token预测:
输入序列: "今天天气真"
模型预测: "好" (概率 0.45) / "不错" (概率 0.32) / "差" (概率 0.08)
关键理解:
- 模型不"理解"含义,它在做统计概率预测
- 但海量数据训练后,这种预测呈现出"智能"的效果
- 你的提示词本质上是在引导概率分布
2.2 Token:AI的"字母表"
Token是模型处理文本的最小单元:
| 语言 | 文本 | Token数 | 说明 |
|---|---|---|---|
| 英文 | “Hello world” | 2 | 每个单词≈1 Token |
| 英文 | “unbelievable” | 3 | 长词会被拆分 |
| 中文 | “你好世界” | 4 | 每个字≈1-2 Token |
| 中文 | “人工智能” | 3 | 常见词可能合并 |
| 代码 | print("hi") |
5 | 符号单独计Token |
Token经济学:
- GPT-4o: 输入 $2.50/百万Token,输出 $10/百万Token
- Claude Opus 4 Sonnet: 输入 $3/百万Token,输出 $15/百万Token
- 1百万Token ≈ 75万个英文单词 ≈ 50万个中文字
实操:Token计数工具
工具1: https://platform.openai.com/tokenizer(OpenAI官方)
工具2: tiktoken库(Python)
工具3: 经验法则 —— 中文1字≈1.5Token,英文1词≈1.3Token
2.3 注意力机制:模型如何"看"你的提示词
Transformer的自注意力机制决定了模型如何分配关注度:
提示词: "作为一位资深Python开发者,请用面向对象的方式实现一个待办事项管理系统"
注意力分配(简化示意):
"资深Python开发者" → 高权重(角色定义)
"面向对象" → 高权重(技术约束)
"待办事项管理系统" → 最高权重(核心任务)
"作为一位" → 低权重(功能词)
"请用...的方式" → 中权重(方式约束)
对你的启示:
- 关键信息前置 — 模型对开头和结尾的注意力更强
- 用精确词汇 — 减少歧义,让注意力集中到正确目标
- 结构化格式 — 帮助模型区分不同信息的层级
2.4 上下文窗口:模型的"工作记忆"
| 模型 | 上下文窗口 | 约等于 |
|---|---|---|
| GPT-4o | 128K tokens | 一本30万字的书 |
| Claude Opus 4 | 200K tokens | 一本50万字的书 |
| Gemini 1.5 Pro | 2M tokens | 10本书 |
| GPT-4o-mini | 16K tokens | 一篇长论文 |
关键认知:
- 上下文窗口 = 输入 + 输出 的Token总量
- 窗口越大越好?不一定 — 中间信息容易被"遗忘"(Lost in the Middle现象)
- 最佳实践:把最重要的指令放在开头和结尾
2.5 Temperature与采样:控制AI的"创造力"
| Temperature | 效果 | 适用场景 |
|---|---|---|
| 0 | 完全确定性,每次输出一样 | 数据提取、分类、代码 |
| 0.3 | 低随机性,稳定可预测 | 商务写作、报告 |
| 0.7 | 中等随机性,平衡创意 | 通用写作、对话 |
| 1.0 | 高随机性,充满创意 | 头脑风暴、创意写作 |
| 1.5+ | 极高随机性,可能胡说 | 一般不推荐 |
三、提示词的基本结构
3.1 最简提示词模型
指令(Instruction): 告诉AI做什么
↓
上下文(Context): 提供背景信息
↓
输入数据(Input): 需要处理的内容
↓
输出格式(Output Format): 指定输出形式
3.2 四要素实战对比
❌ 差的提示词:
帮我分析一下这个数据
✅ 好的提示词:
【指令】请对以下电商销售数据进行分析,找出3个关键趋势和2个改进建议。
【上下文】这是一家主营女装的淘宝店铺,运营6个月,月均GMV 15万。
【输入数据】
- 1月: GMV 8万,退货率 22%,复购率 5%
- 2月: GMV 10万,退货率 20%,复购率 8%
- 3月: GMV 15万,退货率 18%,复购率 12%
- 4月: GMV 13万,退货率 25%,复购率 10%
- 5月: GMV 18万,退货率 15%,复购率 15%
- 6月: GMV 20万,退货率 16%,复购率 18%
【输出格式】
使用以下结构:
1. 数据概览(3行总结)
2. 关键趋势(每条趋势含数据支撑)
3. 改进建议(含预期效果)
3.3 提示词长度的黄金法则
简单任务: 1-3行(翻译、改写、简单问答)
中等任务: 5-15行(分析、写作、策划)
复杂任务: 20-50行(系统设计、完整方案)
超级任务: 50+行(含示例、多步骤、严格约束)
⚠️ 注意:不是越长越好!冗余信息会降低输出质量
四、提示词的六大黄金原则
原则一:明确具体(Be Specific)
| 模糊 ❌ | 明确 ✅ |
|---|---|
| 写篇文章 | 写一篇800字的小红书种草文,产品是XX面霜,针对25-35岁干皮女性 |
| 帮我改代码 | 将这个Python函数从同步改为异步(async/await),保持API兼容 |
| 总结一下 | 用3个要点总结这篇论文的核心发现,每点不超过50字 |
原则二:提供示例(Show, Don’t Tell)
请按以下格式生成产品描述:
【示例】
产品:蓝牙耳机
标题:🎧 静享好声音 | XX蓝牙耳机,降噪黑科技
卖点:① 40dB主动降噪 ② 30小时续航 ③ IP67防水
文案:在喧嚣的城市中,给耳朵一个安静的角落...
【现在请生成】
产品:智能手表
原则三:分步拆解(Step by Step)
请分步完成以下任务:
Step 1: 阅读下方用户评论,提取所有提到的产品问题
Step 2: 将问题按严重程度分为P0/P1/P2三级
Step 3: 针对每个P0问题,给出优化建议
Step 4: 用表格形式输出最终结果
原则四:设定角色(Role Playing)
你是一位拥有15年经验的品牌策划总监,曾服务过Nike、Apple等国际品牌。
你的沟通风格简洁有力,善于用数据说话,擅长抓住消费者心理。
请为以下新品牌制定上市策略...
原则五:限定边界(Set Constraints)
请回答以下问题,但需遵守以下约束:
- 只使用2026年之后的数据
- 不使用专业术语,用大白话解释
- 回答控制在500字以内
- 必须包含至少2个真实案例
- 不要使用"可能"、"大概"等模糊表达
原则六:迭代优化(Iterate & Refine)
第一版 → 审视输出 → 调整提示词 → 第二版 → ... → 满意版本
常见迭代动作:
✦ 增加约束(输出太泛时)
✦ 添加示例(格式不对时)
✦ 细化角色(风格不到位时)
✦ 拆解步骤(逻辑混乱时)
✦ 调整温度(创意/准确度不满时)
五、常见错误与避坑指南
5.1 十大常犯错误
| # | 错误 | 正确做法 |
|---|---|---|
| 1 | 一次塞太多任务 | 拆分为多个独立提示词 |
| 2 | 用否定句描述 | 用肯定句说明要什么 |
| 3 | 不指定输出格式 | 明确要表格/列表/JSON等 |
| 4 | 缺少上下文 | 提供必要背景信息 |
| 5 | 指令含糊不清 | 用精确、具体的描述 |
| 6 | 忽略模型局限 | 了解截止日期和能力边界 |
| 7 | 不检查输出 | 交叉验证重要信息 |
| 8 | 不做版本管理 | 记录每次修改和效果 |
| 9 | 忽略Temperature | 根据任务类型调整 |
| 10 | 不迭代优化 | 至少迭代2-3次 |
5.2 否定句 vs 肯定句
❌ "不要写太长" → 模型不确定多长算"太长"
✅ "控制在300字以内" → 精确约束
❌ "不要用专业术语" → 模型可能仍然使用
✅ "用初中生能理解的语言" → 明确难度级别
❌ "不要列举太多" → 歧义
✅ "给出最重要的3个要点" → 精确数量
六、实战练习
练习1:将差提示词改为好提示词
原始提示词:
翻译这段话
优化方向:
- 指定源语言和目标语言
- 指定翻译风格(直译/意译/本地化)
- 指定受众和使用场景
- 指定专业术语处理方式
练习2:构建你的第一个结构化提示词
任务:为你的本职工作设计一个提示词,要求:
1. 包含四要素(指令/上下文/输入/输出格式)
2. 使用至少2个黄金原则
3. 实际运行并记录输出质量(1-10分)
4. 至少迭代优化1次
练习3:Token成本计算
场景:你需要用GPT-4o处理1000篇产品描述
- 每篇输入约500字(中文)
- 期望输出约300字
- 请计算总Token数和总费用
本课小结
| 概念 | 核心要点 |
|---|---|
| 提示词本质 | 引导模型的概率分布,是AI时代的"编程语言" |
| Token | 模型处理的最小单元,影响成本和上下文容量 |
| 注意力机制 | 关键信息前置,精确词汇,结构化格式 |
| 上下文窗口 | 输入+输出总量限制,重要信息放首尾 |
| Temperature | 0=确定性,0.7=平衡,1.0=高创意 |
| 六大原则 | 明确具体、提供示例、分步拆解、设定角色、限定边界、迭代优化 |
📌 下节课预告:第02课将深入讲解CRISPE、CO-STAR等主流Prompt设计框架,教你用"公式"批量生产高质量提示词。
© 2026 Angel Zhang & Charlie Cao · AI提示词工程实战课 · 版权所有