练习题与思考

一、课前练习

[ ] 练习1：用你自己的话解释大模型和传统 if-else 规则引擎在"理解用户意图"上的本质区别（传统系统基于规则匹配，意图可枚举；大模型基于语义理解，能处理未见过的表达方式；大模型有推理能力，但不够稳定）
[ ] 练习2：设计一个内部文档 AI 问答系统的整体架构（包含文档管理、知识库、检索、生成、安全、运维六大模块），画一个简单的架构图或文字描述
[ ] 练习3：从工程角度列出"调用 OpenAI API + 写几行 Prompt"之外至少 5 个需要额外解决的问题（成本控制、安全防护、可靠性、可观测性、数据管理、用户体验、评估体系、部署运维）

二、基础原理阶段

[ ] 练习4：如果 Transformer 的自注意力机制时间复杂度是 O(n^2)，当上下文窗口非常大时（如 1M Token）会有什么问题？目前有哪些解决方案？
[ ] 练习5：为什么说 Temperature = 0 时模型输出仍然不是完全确定性的？
[ ] 练习6：BPE Tokenizer 对中文和英文的处理有什么区别？这对 Prompt 设计有什么影响？

三、Prompt Engineering 阶段

[ ] 练习7：设计一个 Prompt，让模型从一段新闻中提取：人物、时间、地点、事件、影响，要求输出 JSON 格式
[ ] 练习8：如果你的 Few-shot 示例之间有冲突（比如同一个词在不同示例中分类不同），模型会怎么表现？怎么避免？
[ ] 练习9：怎么量化评估两个 Prompt 版本哪个更好？

四、RAG 阶段

[ ] 练习10：如果 RAG 系统的检索结果总是不相关，你会从哪些环节排查？
[ ] 练习11：为什么混合检索的效果通常比纯向量检索好？有没有例外？
[ ] 练习12：如果文档是表格数据（如 Excel），RAG 该怎么处理？

五、Agent 阶段

[ ] 练习13：如果一个 Agent 在调用工具后始终无法得到满意的结果，你会怎么优化？
[ ] 练习14：多 Agent 协作中，Agent 之间怎么传递上下文才不会丢失关键信息？
[ ] 练习15：怎么设计一个 Agent 的"止损"机制，让它在卡住时能优雅退出？

六、工程化阶段

[ ] 练习16：如果 LLM API 的 P99 延迟突然从 2s 涨到 30s，你会怎么排查和应对？
[ ] 练习17：怎么设计一个成本友好的模型路由策略？
[ ] 练习18：如果你的大模型应用要支持 10 万 DAU，架构上要做什么准备？