04. 题目全景地图 - 大模型面试题库

#题目全景地图

模块	典型考点	更像笔试还是面试
基础与架构	Transformer、attention、decoder-only、复杂度	两者都高频
Tokenizer / RoPE	BPE、WordPiece、SentencePiece、RoPE、ALiBi	笔试更密集
预训练与扩展	scaling law、MoE、data mixing、continue pretrain	面试更喜欢追问
微调与对齐	SFT、LoRA、QLoRA、RLHF、DPO、遗忘	两者都高频
推理与部署	KV cache、batching、量化、吞吐/延迟、引擎对比	平台岗/应用岗高频
RAG	embedding、chunking、召回、重排、评测	应用岗极高频
Agent	ReAct、tool use、memory、workflow、协议	2026 热点
评测与安全	perplexity 局限、faithfulness、幻觉、安全策略	面试更爱深挖
多模态	CLIP、VLM、diffusion、视频理解	相关岗位专考
系统设计	架构拆解、成本、可观测性、并发与 SLA	面试拉开差距

这张地图不是为了把知识切成互不相干的十块，而是为了建立面试时的定位能力。看到一个问题时，先判断它属于哪个模块，再判断它是在问定义、机制、公式、工程实现、系统取舍，还是失败排查。

例如“为什么 KV cache 会爆显存”表面属于推理部署，但答案会同时牵涉 attention 结构、batch 调度、上下文长度、GQA/MQA、显存估算和服务 SLA。再例如“RAG 为什么仍然幻觉”表面属于检索增强，但真正要答的是召回、重排、证据拼接、生成约束、评测和线上观测闭环。

每次读完一个模块，都应该回到这张地图做一次归位：这个模块解决的是模型内部能力、训练行为、推理成本、外部知识、工具执行、评测安全，还是业务系统设计。归位之后，再补一个相邻模块的连接点。例如读完 Tokenizer，要连接上下文窗口和推理成本；读完 RAG，要连接评测、Agent 和系统设计。

面试中很多题会故意跨模块。比如“企业知识库问答很慢且回答不准”至少涉及 RAG 召回、重排、上下文长度、推理 batch、缓存、评测和日志观测。地图的价值就是帮助你不漏模块，也不在一个方向上无限展开。

复盘时可以给每个模块标一个掌握状态：只知道定义、能讲机制、能做比较、能落工程、能讲失败案例。只知道定义的模块适合回到核心答案补基础；能讲机制但不能落工程的模块，适合看系统设计和项目题；能讲工程但没有失败案例的模块，适合补评测、观测和排查。这样地图就不只是目录，而是备考进度表。