Skip to content

练习题与思考


一、课前练习

  • [ ] 练习1:用你自己的话解释大模型和传统 if-else 规则引擎在"理解用户意图"上的本质区别(传统系统基于规则匹配,意图可枚举;大模型基于语义理解,能处理未见过的表达方式;大模型有推理能力,但不够稳定)

  • [ ] 练习2:设计一个内部文档 AI 问答系统的整体架构(包含文档管理、知识库、检索、生成、安全、运维六大模块),画一个简单的架构图或文字描述

  • [ ] 练习3:从工程角度列出"调用 OpenAI API + 写几行 Prompt"之外至少 5 个需要额外解决的问题(成本控制、安全防护、可靠性、可观测性、数据管理、用户体验、评估体系、部署运维)


二、基础原理阶段

  • [ ] 练习4:如果 Transformer 的自注意力机制时间复杂度是 O(n^2),当上下文窗口非常大时(如 1M Token)会有什么问题?目前有哪些解决方案?

  • [ ] 练习5:为什么说 Temperature = 0 时模型输出仍然不是完全确定性的?

  • [ ] 练习6:BPE Tokenizer 对中文和英文的处理有什么区别?这对 Prompt 设计有什么影响?


三、Prompt Engineering 阶段

  • [ ] 练习7:设计一个 Prompt,让模型从一段新闻中提取:人物、时间、地点、事件、影响,要求输出 JSON 格式

  • [ ] 练习8:如果你的 Few-shot 示例之间有冲突(比如同一个词在不同示例中分类不同),模型会怎么表现?怎么避免?

  • [ ] 练习9:怎么量化评估两个 Prompt 版本哪个更好?


四、RAG 阶段

  • [ ] 练习10:如果 RAG 系统的检索结果总是不相关,你会从哪些环节排查?

  • [ ] 练习11:为什么混合检索的效果通常比纯向量检索好?有没有例外?

  • [ ] 练习12:如果文档是表格数据(如 Excel),RAG 该怎么处理?


五、Agent 阶段

  • [ ] 练习13:如果一个 Agent 在调用工具后始终无法得到满意的结果,你会怎么优化?

  • [ ] 练习14:多 Agent 协作中,Agent 之间怎么传递上下文才不会丢失关键信息?

  • [ ] 练习15:怎么设计一个 Agent 的"止损"机制,让它在卡住时能优雅退出?


六、工程化阶段

  • [ ] 练习16:如果 LLM API 的 P99 延迟突然从 2s 涨到 30s,你会怎么排查和应对?

  • [ ] 练习17:怎么设计一个成本友好的模型路由策略?

  • [ ] 练习18:如果你的大模型应用要支持 10 万 DAU,架构上要做什么准备?

基于 VitePress 构建