#一句话备考建议

如果时间有限,最值得先拿下的是这 7 个主题:

  1. Transformer 和 Self-Attention
  2. Tokenizer + RoPE
  3. SFT + LoRA/QLoRA + RLHF/DPO
  4. KV cache + batching + quantization
  5. RAG 全链路
  6. Agent / tool use / workflow
  7. hallucination + evaluation + system design

如果还要再往上补三个最能拉开差距的专题,就是:

  1. 模型架构演化(MoE / GQA / MQA / MLA / SSM
  2. 参数量估算、复杂度与显存分析
  3. 手撕代码与最小模块实现

这 7 块打牢以后,再向多模态、MoE、分布式训练、协议标准化这些方向扩展,效率最高。

#为什么先抓这 7 块

基础架构决定你能否解释模型内部的数据流;微调与对齐决定你能否解释模型行为如何被训练出来;推理部署决定你能否解释线上成本和延迟;RAG/Agent决定你能否解释应用系统如何接外部知识和工具;评测安全决定你能否判断系统是否真的可靠。

这几块不是平均重要,而是构成一条最短闭环:模型怎么计算、怎么训练、怎么部署、怎么接业务、怎么评估。如果时间有限,先拿下闭环,再补 MoE、多模态、长上下文、协议和前沿论文,收益更稳定。

#一周速修验收

  • 每天至少选一个主题,准备一个定义题、一个机制题和一个失败排查题。
  • 每个主题都要能说出一个核心指标,例如延迟、吞吐、准确率、召回率、faithfulness 或成本。
  • 最后用第 38-47 章检查核心答案是否能闭卷复述,用第 48-58 章检查知识点是否漏掉。

#不要忽略的两个边界

第一,备考建议不是学习顺序的唯一来源。已经有项目经验的人应该从项目相关模块开始补短板;完全从零开始的人则先读核心地图和完整答案。第二,热点专题不能替代基础。MoE、MLA、MCP、test-time compute 都有价值,但如果 attention、tokenizer、SFT、KV cache、RAG 和评测还不稳,热点很难讲深。

最实用的做法是每天保持一个闭环:读一章、写三条可复述结论、做一次口头回答、补一个失败边界。只看页面不复述,很容易形成“看懂了但答不出来”的假熟悉。

如果只剩很短时间,就按“高频优先、项目优先、岗位优先”排序。高频优先保证不会漏掉基础题,项目优先保证面试时有真实支撑,岗位优先保证深挖方向不跑偏。不要同时打开太多专项,先把一条主线答扎实,再补相邻模块。

一句话版本可以浓缩成:先把 Transformer、训练对齐、推理部署、RAG/Agent、评测安全这条闭环讲明白,再根据岗位补专项。任何新热点都先问它落在闭环的哪一环、解决什么瓶颈、代价是什么。

这条建议的隐含前提是时间有限。如果时间充足,仍然应该回到完整题库逐章查漏,尤其是数学、优化器、分布式训练和系统设计这些容易被追问的模块。短期策略解决优先级,长期准备仍要靠系统性复盘。