#题目全景地图

模块 典型考点 更像笔试还是面试
基础与架构 Transformer、attention、decoder-only、复杂度 两者都高频
Tokenizer / RoPE BPE、WordPiece、SentencePiece、RoPE、ALiBi 笔试更密集
预训练与扩展 scaling law、MoE、data mixing、continue pretrain 面试更喜欢追问
微调与对齐 SFT、LoRA、QLoRA、RLHF、DPO、遗忘 两者都高频
推理与部署 KV cache、batching、量化、吞吐/延迟、引擎对比 平台岗/应用岗高频
RAG embedding、chunking、召回、重排、评测 应用岗极高频
Agent ReAct、tool use、memory、workflow、协议 2026 热点
评测与安全 perplexity 局限、faithfulness、幻觉、安全策略 面试更爱深挖
多模态 CLIP、VLM、diffusion、视频理解 相关岗位专考
系统设计 架构拆解、成本、可观测性、并发与 SLA 面试拉开差距

#地图读法

这张地图不是为了把知识切成互不相干的十块,而是为了建立面试时的定位能力。看到一个问题时,先判断它属于哪个模块,再判断它是在问定义、机制、公式、工程实现、系统取舍,还是失败排查。

例如“为什么 KV cache 会爆显存”表面属于推理部署,但答案会同时牵涉 attention 结构、batch 调度、上下文长度、GQA/MQA、显存估算和服务 SLA。再例如“RAG 为什么仍然幻觉”表面属于检索增强,但真正要答的是召回、重排、证据拼接、生成约束、评测和线上观测闭环。

#几个容易混淆的边界

  • 基础与架构回答模型内部怎么表示和计算,不直接等同于系统部署能力。
  • 微调与对齐回答行为如何被数据和偏好塑形,不等同于线上安全一定解决。
  • RAG 与 Agent回答外部知识和工具如何接入,不等同于模型自身能力变强。
  • 评测与系统设计负责把模型指标接到业务指标、成本、可靠性和风险上。

#用地图做复盘

每次读完一个模块,都应该回到这张地图做一次归位:这个模块解决的是模型内部能力、训练行为、推理成本、外部知识、工具执行、评测安全,还是业务系统设计。归位之后,再补一个相邻模块的连接点。例如读完 Tokenizer,要连接上下文窗口和推理成本;读完 RAG,要连接评测、Agent 和系统设计。

面试中很多题会故意跨模块。比如“企业知识库问答很慢且回答不准”至少涉及 RAG 召回、重排、上下文长度、推理 batch、缓存、评测和日志观测。地图的价值就是帮助你不漏模块,也不在一个方向上无限展开。

复盘时可以给每个模块标一个掌握状态:只知道定义、能讲机制、能做比较、能落工程、能讲失败案例。只知道定义的模块适合回到核心答案补基础;能讲机制但不能落工程的模块,适合看系统设计和项目题;能讲工程但没有失败案例的模块,适合补评测、观测和排查。这样地图就不只是目录,而是备考进度表。