#笔试题最常见的 6 种题型

  1. 概念辨析题:例如 LoRA vs QLoRARAG vs Fine-tuningEncoder-only vs Decoder-only
  2. 原理填空题:例如 Attention 公式、RoPE 特点、PPO 流程顺序。
  3. 多选/判断题:尤其喜欢考细节边界,例如“哪些属于 PEFT”“哪些方法会影响推理显存”。
  4. 简答题:通常是 解释 RLHF说明 hallucination 成因写出 RAG 流程 这类 3-6 行能答完的题。
  5. 轻量方案题:例如“如何设计企业文档问答系统”“如何降低线上成本”。
  6. 代码/伪代码题:在算法工程岗和平台岗里更常见,例如采样、日志处理、向量检索流程、服务并发控制。

#题型边界

概念辨析题考的是边界,不是百科解释。回答时要说明二者目标、机制、成本或适用场景哪里不同。原理填空题考的是最小公式和流程顺序,例如 attention 公式里为什么有缩放项、PPO 为什么需要 clip。轻量方案题则要求你把知识点组织成可执行链路,而不是只列名词。

笔试题的共同特点是可评分,所以答案要短、准、结构清楚。不要在填空题里写一大段项目经验,也不要在方案题里只写一句定义。真正的得分点通常藏在关键词:输入输出、关键公式、必要条件、失败边界。

#复盘清单

  • 每个概念至少准备一句定义、一句机制、一句边界。
  • 涉及公式时,能说明符号含义和复杂度,不只背表达式。
  • 涉及方案时,按“目标 - 数据/请求链路 - 模型/系统组件 - 评测指标 - 风险”组织。

#笔试准备方法

笔试复习要优先建立“短答案模板”。概念题用两句话:第一句定义,第二句边界;公式题用三步:写公式、解释符号、说明复杂度或适用条件;方案题用五段:目标、链路、组件、指标、风险。这样做能避免答案过长却没有得分点。

刷题时要记录错因,不只记录错题本身。常见错因包括把相近术语混淆、忽略前提条件、只记结论不记公式符号、把训练阶段和推理阶段的资源开销混在一起。错因分类比题目数量更重要,因为同一种错因会在不同题型里反复出现。

考前最后一轮可以做“压缩答案”训练:每个高频概念用 30 秒写出定义、关键机制和一句边界。写不出来的概念不要急着看新题,而是回到对应章节补完整答案。笔试的时间压力很强,真正有效的准备不是知道很多长解释,而是能在短时间内写出准确关键词。

做选择题时尤其要看限定词,例如“总是”“一定”“只要”“不会影响”。大模型题里的很多错误选项不是完全胡说,而是把某个条件说绝对了:量化通常省显存但不保证无损,RAG 可以缓解幻觉但不保证消除幻觉,batching 提高吞吐但不一定降低单请求延迟。

简答题则要避免过度展开。通常 3-6 行最稳:第一行给定义,第二行讲机制,第三行讲优点或适用场景,最后一行补边界。比如“什么是 DPO”可以先说它是基于偏好数据的直接偏好优化,再说它绕开显式 reward model 和在线 RL,最后补充它仍依赖偏好数据质量和参考模型约束。