#题目全景地图
| 模块 | 典型考点 | 更像笔试还是面试 |
|---|---|---|
| 基础与架构 | Transformer、attention、decoder-only、复杂度 | 两者都高频 |
| Tokenizer / RoPE | BPE、WordPiece、SentencePiece、RoPE、ALiBi | 笔试更密集 |
| 预训练与扩展 | scaling law、MoE、data mixing、continue pretrain | 面试更喜欢追问 |
| 微调与对齐 | SFT、LoRA、QLoRA、RLHF、DPO、遗忘 | 两者都高频 |
| 推理与部署 | KV cache、batching、量化、吞吐/延迟、引擎对比 | 平台岗/应用岗高频 |
| RAG | embedding、chunking、召回、重排、评测 | 应用岗极高频 |
| Agent | ReAct、tool use、memory、workflow、协议 | 2026 热点 |
| 评测与安全 | perplexity 局限、faithfulness、幻觉、安全策略 | 面试更爱深挖 |
| 多模态 | CLIP、VLM、diffusion、视频理解 | 相关岗位专考 |
| 系统设计 | 架构拆解、成本、可观测性、并发与 SLA | 面试拉开差距 |
#地图读法
这张地图不是为了把知识切成互不相干的十块,而是为了建立面试时的定位能力。看到一个问题时,先判断它属于哪个模块,再判断它是在问定义、机制、公式、工程实现、系统取舍,还是失败排查。
例如“为什么 KV cache 会爆显存”表面属于推理部署,但答案会同时牵涉 attention 结构、batch 调度、上下文长度、GQA/MQA、显存估算和服务 SLA。再例如“RAG 为什么仍然幻觉”表面属于检索增强,但真正要答的是召回、重排、证据拼接、生成约束、评测和线上观测闭环。
#几个容易混淆的边界
- 基础与架构回答模型内部怎么表示和计算,不直接等同于系统部署能力。
- 微调与对齐回答行为如何被数据和偏好塑形,不等同于线上安全一定解决。
- RAG 与 Agent回答外部知识和工具如何接入,不等同于模型自身能力变强。
- 评测与系统设计负责把模型指标接到业务指标、成本、可靠性和风险上。
#用地图做复盘
每次读完一个模块,都应该回到这张地图做一次归位:这个模块解决的是模型内部能力、训练行为、推理成本、外部知识、工具执行、评测安全,还是业务系统设计。归位之后,再补一个相邻模块的连接点。例如读完 Tokenizer,要连接上下文窗口和推理成本;读完 RAG,要连接评测、Agent 和系统设计。
面试中很多题会故意跨模块。比如“企业知识库问答很慢且回答不准”至少涉及 RAG 召回、重排、上下文长度、推理 batch、缓存、评测和日志观测。地图的价值就是帮助你不漏模块,也不在一个方向上无限展开。
复盘时可以给每个模块标一个掌握状态:只知道定义、能讲机制、能做比较、能落工程、能讲失败案例。只知道定义的模块适合回到核心答案补基础;能讲机制但不能落工程的模块,适合看系统设计和项目题;能讲工程但没有失败案例的模块,适合补评测、观测和排查。这样地图就不只是目录,而是备考进度表。