#回答大模型面试题的通用模板

如果用户不要求极短回答,一个成熟答案通常都可以按下面 5 步展开:

  1. 先定义问题:这个概念是什么,要解决什么问题。
  2. 再讲核心机制:它是怎么工作的,数据/信息如何流动。
  3. 然后讲优点:为什么大家会用它。
  4. 再讲局限和 trade-off:成本、风险、边界条件是什么。
  5. 最后落到实战:在什么场景下适合用,不适合用什么。

例如回答“LoRA 是什么”:

  • 不是只说“低秩分解”。
  • 应该说:LoRA 通过冻结原模型,只学习低秩增量矩阵,降低训练显存和参数更新量;优点是便宜、快、适合多任务 adapter 管理;局限是表达能力有限,遇到任务分布差异大时可能不如全参数微调。