第01课 提示词的底层逻辑

第01课 提示词的底层逻辑

本课目标

理解大语言模型如何"读懂"你的提示词,掌握Token、注意力机制、上下文窗口等核心概念,为后续所有高级技术打下坚实基础。


一、为什么提示词如此重要

1.1 AI时代的"编程语言"

传统编程用代码与计算机对话,AI时代用自然语言与模型对话。提示词就是这个时代最重要的"编程语言"。

一个事实:

  • 同一个模型,不同的提示词,输出质量可以相差 10倍以上
  • 顶级Prompt Engineer年薪可达 $300K+(数据来源:Anthropic、OpenAI招聘)
  • 全球Prompt交易市场规模预计2026年突破 $5亿

1.2 提示词工程 vs 随便问问

维度 随便问问 提示词工程
输入 “帮我写篇文章” 结构化指令+角色+约束+示例
输出质量 泛泛而谈,需多次修改 一次命中,专业水准
效率 反复来回3-5次 1-2次完成
可复用性 每次重新想 模板化、可迭代
变现能力 可卖模板、接单、做课程

1.3 Prompt Engineer的技能图谱

提示词工程师能力模型
├── 基础层:语言表达 + 逻辑思维
├── 技术层:LLM原理 + Prompt框架 + 调优
├── 应用层:垂直场景 + 多模态 + API
├── 商业层:变现路径 + 个人品牌 + 定价
└── 进化层:持续学习 + 社区 + 前沿追踪

二、大语言模型的工作原理

2.1 什么是LLM

大语言模型(Large Language Model)的核心是下一个Token预测

输入序列: "今天天气真"
模型预测: "好" (概率 0.45) / "不错" (概率 0.32) / "差" (概率 0.08)

关键理解:

  • 模型不"理解"含义,它在做统计概率预测
  • 但海量数据训练后,这种预测呈现出"智能"的效果
  • 你的提示词本质上是在引导概率分布

2.2 Token:AI的"字母表"

Token是模型处理文本的最小单元:

语言 文本 Token数 说明
英文 “Hello world” 2 每个单词≈1 Token
英文 “unbelievable” 3 长词会被拆分
中文 “你好世界” 4 每个字≈1-2 Token
中文 “人工智能” 3 常见词可能合并
代码 print("hi") 5 符号单独计Token

Token经济学:

  • GPT-4o: 输入 $2.50/百万Token,输出 $10/百万Token
  • Claude Opus 4 Sonnet: 输入 $3/百万Token,输出 $15/百万Token
  • 1百万Token ≈ 75万个英文单词 ≈ 50万个中文字

实操:Token计数工具

工具1: https://platform.openai.com/tokenizer(OpenAI官方)
工具2: tiktoken库(Python)
工具3: 经验法则 —— 中文1字≈1.5Token,英文1词≈1.3Token

2.3 注意力机制:模型如何"看"你的提示词

Transformer的自注意力机制决定了模型如何分配关注度

提示词: "作为一位资深Python开发者,请用面向对象的方式实现一个待办事项管理系统"

注意力分配(简化示意):
"资深Python开发者" → 高权重(角色定义)
"面向对象" → 高权重(技术约束)
"待办事项管理系统" → 最高权重(核心任务)
"作为一位" → 低权重(功能词)
"请用...的方式" → 中权重(方式约束)

对你的启示:

  1. 关键信息前置 — 模型对开头和结尾的注意力更强
  2. 用精确词汇 — 减少歧义,让注意力集中到正确目标
  3. 结构化格式 — 帮助模型区分不同信息的层级

2.4 上下文窗口:模型的"工作记忆"

模型 上下文窗口 约等于
GPT-4o 128K tokens 一本30万字的书
Claude Opus 4 200K tokens 一本50万字的书
Gemini 1.5 Pro 2M tokens 10本书
GPT-4o-mini 16K tokens 一篇长论文

关键认知:

  • 上下文窗口 = 输入 + 输出 的Token总量
  • 窗口越大越好?不一定 — 中间信息容易被"遗忘"(Lost in the Middle现象)
  • 最佳实践:把最重要的指令放在开头和结尾

2.5 Temperature与采样:控制AI的"创造力"

Temperature 效果 适用场景
0 完全确定性,每次输出一样 数据提取、分类、代码
0.3 低随机性,稳定可预测 商务写作、报告
0.7 中等随机性,平衡创意 通用写作、对话
1.0 高随机性,充满创意 头脑风暴、创意写作
1.5+ 极高随机性,可能胡说 一般不推荐

三、提示词的基本结构

3.1 最简提示词模型

指令(Instruction): 告诉AI做什么
    ↓
上下文(Context): 提供背景信息
    ↓
输入数据(Input): 需要处理的内容
    ↓
输出格式(Output Format): 指定输出形式

3.2 四要素实战对比

❌ 差的提示词:

帮我分析一下这个数据

✅ 好的提示词:

【指令】请对以下电商销售数据进行分析,找出3个关键趋势和2个改进建议。

【上下文】这是一家主营女装的淘宝店铺,运营6个月,月均GMV 15万。

【输入数据】
- 1月: GMV 8万,退货率 22%,复购率 5%
- 2月: GMV 10万,退货率 20%,复购率 8%
- 3月: GMV 15万,退货率 18%,复购率 12%
- 4月: GMV 13万,退货率 25%,复购率 10%
- 5月: GMV 18万,退货率 15%,复购率 15%
- 6月: GMV 20万,退货率 16%,复购率 18%

【输出格式】
使用以下结构:
1. 数据概览(3行总结)
2. 关键趋势(每条趋势含数据支撑)
3. 改进建议(含预期效果)

3.3 提示词长度的黄金法则

简单任务: 1-3行(翻译、改写、简单问答)
中等任务: 5-15行(分析、写作、策划)
复杂任务: 20-50行(系统设计、完整方案)
超级任务: 50+行(含示例、多步骤、严格约束)

⚠️ 注意:不是越长越好!冗余信息会降低输出质量

四、提示词的六大黄金原则

原则一:明确具体(Be Specific)

模糊 ❌ 明确 ✅
写篇文章 写一篇800字的小红书种草文,产品是XX面霜,针对25-35岁干皮女性
帮我改代码 将这个Python函数从同步改为异步(async/await),保持API兼容
总结一下 用3个要点总结这篇论文的核心发现,每点不超过50字

原则二:提供示例(Show, Don’t Tell)

请按以下格式生成产品描述:

【示例】
产品:蓝牙耳机
标题:🎧 静享好声音 | XX蓝牙耳机,降噪黑科技
卖点:① 40dB主动降噪 ② 30小时续航 ③ IP67防水
文案:在喧嚣的城市中,给耳朵一个安静的角落...

【现在请生成】
产品:智能手表

原则三:分步拆解(Step by Step)

请分步完成以下任务:
Step 1: 阅读下方用户评论,提取所有提到的产品问题
Step 2: 将问题按严重程度分为P0/P1/P2三级
Step 3: 针对每个P0问题,给出优化建议
Step 4: 用表格形式输出最终结果

原则四:设定角色(Role Playing)

你是一位拥有15年经验的品牌策划总监,曾服务过Nike、Apple等国际品牌。
你的沟通风格简洁有力,善于用数据说话,擅长抓住消费者心理。
请为以下新品牌制定上市策略...

原则五:限定边界(Set Constraints)

请回答以下问题,但需遵守以下约束:
- 只使用2026年之后的数据
- 不使用专业术语,用大白话解释
- 回答控制在500字以内
- 必须包含至少2个真实案例
- 不要使用"可能"、"大概"等模糊表达

原则六:迭代优化(Iterate & Refine)

第一版 → 审视输出 → 调整提示词 → 第二版 → ... → 满意版本

常见迭代动作:
✦ 增加约束(输出太泛时)
✦ 添加示例(格式不对时)
✦ 细化角色(风格不到位时)
✦ 拆解步骤(逻辑混乱时)
✦ 调整温度(创意/准确度不满时)

五、常见错误与避坑指南

5.1 十大常犯错误

# 错误 正确做法
1 一次塞太多任务 拆分为多个独立提示词
2 用否定句描述 用肯定句说明要什么
3 不指定输出格式 明确要表格/列表/JSON等
4 缺少上下文 提供必要背景信息
5 指令含糊不清 用精确、具体的描述
6 忽略模型局限 了解截止日期和能力边界
7 不检查输出 交叉验证重要信息
8 不做版本管理 记录每次修改和效果
9 忽略Temperature 根据任务类型调整
10 不迭代优化 至少迭代2-3次

5.2 否定句 vs 肯定句

❌ "不要写太长" → 模型不确定多长算"太长"
✅ "控制在300字以内" → 精确约束

❌ "不要用专业术语" → 模型可能仍然使用
✅ "用初中生能理解的语言" → 明确难度级别

❌ "不要列举太多" → 歧义
✅ "给出最重要的3个要点" → 精确数量

六、实战练习

练习1:将差提示词改为好提示词

原始提示词:

翻译这段话

优化方向:

  • 指定源语言和目标语言
  • 指定翻译风格(直译/意译/本地化)
  • 指定受众和使用场景
  • 指定专业术语处理方式

练习2:构建你的第一个结构化提示词

任务:为你的本职工作设计一个提示词,要求:
1. 包含四要素(指令/上下文/输入/输出格式)
2. 使用至少2个黄金原则
3. 实际运行并记录输出质量(1-10分)
4. 至少迭代优化1次

练习3:Token成本计算

场景:你需要用GPT-4o处理1000篇产品描述
- 每篇输入约500字(中文)
- 期望输出约300字
- 请计算总Token数和总费用

本课小结

概念 核心要点
提示词本质 引导模型的概率分布,是AI时代的"编程语言"
Token 模型处理的最小单元,影响成本和上下文容量
注意力机制 关键信息前置,精确词汇,结构化格式
上下文窗口 输入+输出总量限制,重要信息放首尾
Temperature 0=确定性,0.7=平衡,1.0=高创意
六大原则 明确具体、提供示例、分步拆解、设定角色、限定边界、迭代优化

📌 下节课预告:第02课将深入讲解CRISPE、CO-STAR等主流Prompt设计框架,教你用"公式"批量生产高质量提示词。


© 2026 Angel Zhang & Charlie Cao · AI提示词工程实战课 · 版权所有