72. 数学基础专项强化题库（第十批：离散数学、概率论、线性代数与微积分）

#数学基础专项强化题库（第十批：离散数学、概率论、线性代数与微积分）

很多大模型岗位不会直接说“我们考数学”，但会在优化器、损失函数、注意力、概率建模、对齐训练、PCA/SVD、拉格朗日乘数法、凸优化、梯度与 Hessian 这些问题里持续追问。如果这些底层数学不稳，面试看起来就会像“会背工程词，但解释不到根上”。所以这一节不是为了做纯数学竞赛，而是为了把最常在机器学习、深度学习、训练系统讨论里反复出现的数学知识点补齐到“能讲原理、能解释公式直觉、能接回工程实现”的水平。

#核心术语先对齐

离散数学帮助解释命题、图、组合和复杂度；概率论帮助解释采样、期望、方差、KL 和不确定性；线性代数帮助解释 embedding、矩阵乘法、SVD、PCA 和低秩结构；微积分与优化帮助解释梯度、Hessian、反向传播、约束和数值稳定。

数学专项的目标不是把推导写得越长越好，而是让每个公式都能说出对象、维度、直觉和工程含义。例如 KL 不只是一个公式，它解释了分布差异和对齐训练里的约束；Hessian 不只是二阶导，它解释了曲率、条件数和优化稳定性。

#阅读顺序

先读第 73 章速览，确认高频数学问题范围。
再读第 74 章逐题详细解答，补齐基础数学对象。
如果还要拔高，继续读第 75-77 章的高阶追问和详细解答。

#数学题的答题底线

每个数学答案至少要说清对象类型、公式含义和使用边界。对象类型包括标量、向量、矩阵、随机变量、分布和函数；公式含义要能翻译成中文；使用边界要说明独立性、可微性、凸性、样本量、数值稳定或维度匹配等前提。

大模型面试里的数学很少要求纯粹炫技推导，更看重你能否把公式接回训练和推理。例如 softmax 接交叉熵和采样，SVD 接低秩和压缩，KL 接对齐约束，Hessian 接优化曲率，Monte Carlo 接评测方差和拒绝采样。

复习时可以采用“一个公式三句话”：第一句说对象和维度，第二句说公式在计算什么，第三句说它在 LLM 或 Quant 中对应什么场景。比如 \(\mathbb{E}[X]\) 是随机变量的长期平均，在采样评测里对应平均指标；\(w^T\Sigma w\) 是组合方差，在风险控制里对应资产共同波动。这样公式就不会变成孤立记忆。

如果公式里有矩阵或概率，一定要补维度和条件。维度检查能防止把向量、矩阵和标量混用；条件检查能防止把独立、同分布、可微、正定、凸性等前提忘掉。很多数学追问并不难，难在能否主动说出这些边界。

数学专项也适合和手写代码结合。比如 softmax 可以手写稳定实现，最小二乘可以写正规方程或梯度解法，Monte Carlo 可以写采样估计，SVD/PCA 可以解释输入输出形状。把公式落到小例子里，理解会比纯背诵稳定很多。

读完本入口后，至少要能判断一个追问主要依赖哪门数学：变化率看微积分，空间结构看线代，不确定性看概率统计，流程和复杂度看离散数学。