全书阅读:https://github.com/xiaer-ai42/infinite_archives/blob/main/books/Advanced_Prompting.md
提示工程进阶:思维链与结构化提示
书籍大纲
第一章:提示工程基础与演进
- 1.1 从命令到对话:交互范式的转变
- 1.2 提示工程的核心原则
- 1.3 Zero-shot与Few-shot学习
- 1.4 提示模板设计模式
- 1.5 常见陷阱与避坑指南
- 1.6 提示工程的理论基础
第二章:思维链推理(Chain-of-Thought)
- 2.1 思维链的发现与原理
- 2.2 标准思维链与自洽性思维链
- 2.3 零样本思维链(Zero-shot CoT)
- 2.4 思维链的适用场景与局限
- 2.5 思维链的变体:Least-to-Most、Decomposed
- 2.6 思维链的数学基础与理论解释
第三章:高级推理技术
- 3.1 思维树(Tree of Thoughts)
- 3.2 思维图(Graph of Thoughts)
- 3.3 自我反思与自评估
- 3.4 ReAct:推理与行动的结合
- 3.5 自我一致性(Self-Consistency)
- 3.6 多路径推理与集成
第四章:结构化提示设计
- 4.1 结构化提示的优势
- 4.2 角色设定与人设提示
- 4.3 任务分解与步骤化
- 4.4 输出格式控制
- 4.5 上下文窗口优化
- 4.6 模板化与参数化提示
第五章:多轮对话与上下文管理
- 5.1 对话历史管理策略
- 5.2 长对话的压缩与摘要
- 5.3 动态上下文选择
- 5.4 对话状态追踪
- 5.5 多任务对话架构
- 5.6 实战:构建智能对话系统
第六章:工具调用与外部知识
- 6.1 Function Calling原理
- 6.2 工具描述与接口设计
- 6.3 多工具编排策略
- 6.4 检索增强生成(RAG)
- 6.5 知识注入与提示融合
- 6.6 实战:构建工具使用型Agent
第七章:提示优化与自动化
- 7.1 自动提示优化(APO)
- 7.2 基于梯度的提示优化
- 7.3 提示压缩与蒸馏
- 7.4 A/B测试与迭代优化
- 7.5 提示版本管理
- 7.6 提示评估框架
第八章:行业应用与最佳实践
- 8.1 代码生成与编程辅助
- 8.2 数据分析与洞察提取
- 8.3 内容创作与营销文案
- 8.4 教育与个性化学习
- 8.5 企业知识管理与问答
- 8.6 提示工程的未来趋势

2.6 思维链的数学基础与理论解释
2.6.1 为什么思维链有效?——理论视角
思维链的有效性可以从多个理论角度解释:
计算复杂性视角
从计算复杂性理论来看,某些问题在固定计算深度下无法解决。思维链实际上将线性深度的计算"展开"到序列中,使得模型能够模拟更深的计算图。
贝叶斯推理视角
可以将思维链视为一种近似贝叶斯推理。每一步推理都更新模型对最终答案的"信念"。
P(答案|问题) = ∫ P(答案|推理路径) × P(推理路径|问题) d推理路径思维链显式地采样并评估了这些推理路径。
注意力机制视角
在Transformer中,后生成的token可以attend到之前生成的所有token。这意味着后续的推理步骤可以"看到"并利用之前的推理结果。
步骤1的输出:[计算中间值A] 步骤2的输出:[使用A计算B] ← 可以attend到步骤1 步骤3的输出:[使用B计算C] ← 可以attend到步骤1和2 ...2.6.2 思维链的局限性理论
不可判定性问题
某些问题本质上是不可计算的(如图灵停机问题)。思维链无法突破这一理论限制。
上下文窗口限制
对于需要O(n)或更多步骤的问题,思维链可能超出上下文窗口。这是一个实际问题,而非理论限制。
错误累积
思维链的每一步都有可能出错。对于需要n步的推理,假设每步正确率为p,则整体正确率为p^n。
2.6.3 最优思维链长度
研究者发现,思维链的长度存在最优点:
经验法则
最优长度 ≈ log(问题复杂度) × 关键步骤数示例
问题:23 × 47 = ? 过短的CoT: 23 × 47 = 1081(直接给出,可能出错) 适中的CoT: 23 × 47 = 23 × 40 + 23 × 7 = 920 + 161 = 1081(正确) 过长的CoT: 让我详细分析这个乘法问题。 首先,23是一个质数... 47也是一个质数... 让我使用分配律... (冗余信息增加出错概率)2.6.4 思维链与涌现能力
思维链是大型语言模型**涌现能力(Emergent Abilities)**的典型例子。研究发现,思维链的效果在模型规模超过一定阈值后才显著提升。
规模效应曲线
准确率 │ 100%├─────────────────────●●●● │ ●●● 80%├ ●● │ ● 60%├ ● │ ● 40%├ ● │ ● 20%├ ● │● 0├──┬──┬──┬──┬──┬──┬──┬── 1B 10B 30B 70B 175B 540B 模型参数量这一发现被称为"相变"现象:模型在某规模之前几乎无效,之后突然变得有效。
为什么需要大规模?
本章小结
思维链(Chain-of-Thought)是提示工程领域最重要的发现之一。它通过要求模型展示推理过程,显著提升了复杂推理任务的性能。
关键要点:
核心原理:思维链让模型从"直觉回答"转向"逐步推理",激活了更深层的计算能力。
主要变体:
适用场景:数学推理、常识推理、符号推理、复杂决策
局限性:知识缺口、精确记忆、纯计算、过度推理
高级技术:Least-to-Most、Decomposed、Plan-and-Solve等变体进一步扩展了CoT的能力
在下一章,我们将探索更高级的推理技术,包括思维树、思维图和自我反思等方法,这些方法建立在思维链的基础上,但采用了更复杂的推理架构。
参考文献: