#这份调研回答什么问题

这份调研不是简单罗列零散题目,而是想回答四个更重要的问题:

  1. 当前大模型岗位到底主要考哪些方向。
  2. 笔试和面试分别喜欢怎么考,同一个知识点会如何变形。
  3. 哪些题是“必须会”的高频题,哪些题是“拉开差距”的进阶题。
  4. 面对大模型岗位,应该如何组织自己的回答,而不是只背定义。

#核心术语先对齐

笔试在这里指限时、结构化、可评分的题型,重点看概念边界、公式记忆、流程顺序和简单推导是否稳定;面试则更像连续追问,重点看你能否把定义讲成机制,把机制讲成取舍,再把取舍落到项目或系统实现。

高频题不是“每家公司必问同一句话”,而是同一个知识点会反复以不同形式出现。例如 KV cache 可能被问成显存估算、推理加速、长上下文瓶颈或服务调度问题。进阶题通常不是新名词更多,而是要求你解释失败场景、替代方案和工程边界。

#如何使用本页

读本页时只需要建立一个判断标准:后面的每一章都应该帮你回答“考什么、为什么考、怎么答、答到哪里算够”。如果某个概念只能背定义,不能说明它解决的问题、核心机制、代价和适用场景,就还没有达到面试可用状态。

  • 先读第 03-04 章,确认十个核心模块和整体地图。
  • 再读第 05-14 章,只建立知识树,不急着背完整答案。
  • 最后读第 38-47 章,把核心题逐题补成可复述的标准答案。

#读完后的检查

本章完成后,应该能把整份题库看成一套准备流程,而不是一堆链接。第一步是定位岗位,第二步是确认核心模块,第三步是把每个模块拆成定义、机制、取舍、实现和失败边界。后续章节凡是出现新名词,都要放回这个流程里判断它解决哪一类问题。

常见误区是只收集题目数量,忽略题目背后的复用结构。例如 LoRA、QLoRA、Adapter、Prefix Tuning 看起来是不同名词,实际都在考“如何低成本改变模型行为”;KV cache、continuous batching、投机解码看起来是不同系统点,实际都在考“推理阶段如何在延迟、吞吐和显存之间取舍”。能看出这种结构,后面学习会快很多。

本题库的最小学习产出应该是一张自己的知识地图:每个模块写下 3 个必会概念、2 个常见追问、1 个项目或系统连接点。比如 RAG 模块至少要写出 chunking、embedding、rerank,常见追问是召回差和幻觉,系统连接点是日志、评测和回退。用这种方式学习,后续读任何章节都能知道它补的是哪一块短板。

最终验收不是“读完多少页”,而是能否把一道陌生题放进已有框架里。例如面试官问“为什么长上下文成本高”,你应能判断它同时属于位置编码、attention 复杂度、KV cache、推理部署和系统成本,而不是只回答“因为 token 多”。

如果某个章节读完后不能产出这类归类判断,就不要急着进入下一个专题。先回到本章的问题框架,补齐“考什么、为什么考、怎么答、怎么验证”。这个习惯能避免资料越读越散,也能让后面的专项强化服务于同一个目标。