01. 这份调研回答什么问题 - 大模型面试题库

#这份调研回答什么问题

这份调研不是简单罗列零散题目，而是想回答四个更重要的问题：

当前大模型岗位到底主要考哪些方向。
笔试和面试分别喜欢怎么考，同一个知识点会如何变形。
哪些题是“必须会”的高频题，哪些题是“拉开差距”的进阶题。
面对大模型岗位，应该如何组织自己的回答，而不是只背定义。

#核心术语先对齐

笔试在这里指限时、结构化、可评分的题型，重点看概念边界、公式记忆、流程顺序和简单推导是否稳定；面试则更像连续追问，重点看你能否把定义讲成机制，把机制讲成取舍，再把取舍落到项目或系统实现。

高频题不是“每家公司必问同一句话”，而是同一个知识点会反复以不同形式出现。例如 KV cache 可能被问成显存估算、推理加速、长上下文瓶颈或服务调度问题。进阶题通常不是新名词更多，而是要求你解释失败场景、替代方案和工程边界。

#如何使用本页

读本页时只需要建立一个判断标准：后面的每一章都应该帮你回答“考什么、为什么考、怎么答、答到哪里算够”。如果某个概念只能背定义，不能说明它解决的问题、核心机制、代价和适用场景，就还没有达到面试可用状态。

先读第 03-04 章，确认十个核心模块和整体地图。
再读第 05-14 章，只建立知识树，不急着背完整答案。
最后读第 38-47 章，把核心题逐题补成可复述的标准答案。

#读完后的检查

本章完成后，应该能把整份题库看成一套准备流程，而不是一堆链接。第一步是定位岗位，第二步是确认核心模块，第三步是把每个模块拆成定义、机制、取舍、实现和失败边界。后续章节凡是出现新名词，都要放回这个流程里判断它解决哪一类问题。

常见误区是只收集题目数量，忽略题目背后的复用结构。例如 LoRA、QLoRA、Adapter、Prefix Tuning 看起来是不同名词，实际都在考“如何低成本改变模型行为”；KV cache、continuous batching、投机解码看起来是不同系统点，实际都在考“推理阶段如何在延迟、吞吐和显存之间取舍”。能看出这种结构，后面学习会快很多。

本题库的最小学习产出应该是一张自己的知识地图：每个模块写下 3 个必会概念、2 个常见追问、1 个项目或系统连接点。比如 RAG 模块至少要写出 chunking、embedding、rerank，常见追问是召回差和幻觉，系统连接点是日志、评测和回退。用这种方式学习，后续读任何章节都能知道它补的是哪一块短板。

最终验收不是“读完多少页”，而是能否把一道陌生题放进已有框架里。例如面试官问“为什么长上下文成本高”，你应能判断它同时属于位置编码、attention 复杂度、KV cache、推理部署和系统成本，而不是只回答“因为 token 多”。

如果某个章节读完后不能产出这类归类判断，就不要急着进入下一个专题。先回到本章的问题框架，补齐“考什么、为什么考、怎么答、怎么验证”。这个习惯能避免资料越读越散，也能让后面的专项强化服务于同一个目标。