算法在替你面试:ATS 如何用随机性重塑招聘市场

算法在替你面试:ATS 如何用随机性重塑招聘市场

在传统认知里,招聘是一件“越客观越好”的事情:简历筛选、技能匹配、面试评估,一切都应该尽可能标准化、可解释。但最近 Hacker News 上的一篇讨论却把这种幻想撕开了一道口子——当 ATS(自动化招聘系统)开始深度引入 LLM 后,筛选结果不再只是“对或错”,而更像是一场带有随机性的概率游戏。[1]

更令人不安的是:同一份简历,多次投递可能得到完全不同的结果。


LLM 驱动的 ATS:从规则系统走向概率系统

从“打分器”到“采样器”

传统 ATS 多数依赖规则系统:关键词匹配、学历筛选、经验年限阈值等,本质上是确定性的过滤器。

而引入 LLM 后,流程变成了另一种形态:

  • 简历 → embedding / prompt
  • LLM 生成评分或排序
  • 输出候选人优先级

关键变化在于:输出不再是严格确定的,而是分布式的结果。

HN 评论中有一个技术争议点很典型:有人误以为 temperature=0.1 可以让模型“几乎确定性输出”。但评论者指出,这种理解是错误的——temperature 只是改变概率分布的“陡峭程度”,并不会让系统真正变成 deterministic。[1]

换句话说,即使你不显式引入随机函数,LLM 本身就在做采样。


同一份简历,不同命运:随机性的真实影响

“65% 的失败率”背后的不确定性

一条高赞评论给出了一个非常直观但令人不安的观察:

同一份简历,在系统里可能 65% 的情况下被拒绝。[1]

这句话的重点不只是“失败率高”,而是“同一输入,多次输出不同”。

如果把 ATS 看作一个函数,它更像:

$$ f(\text{resume}) \rightarrow \text{distribution of outcomes} $$

而不是:

$$ f(\text{resume}) \rightarrow \text{yes/no} $$

这意味着什么?

  • 你的“通过”不再是能力问题,而是概率问题
  • 你的申请时间、顺序、上下文可能影响结果
  • 系统状态(甚至提示词细微差异)都会改变输出

在高流量招聘场景下,这种不确定性被进一步放大。


高吞吐招聘下的“概率筛选”

另一个评论提供了更现实的背景:一些技术岗位 ATS 每小时可能处理 100+ 份申请。[1]

在这种规模下:

  • 人工筛选不可能逐份精读
  • 自动化系统必须“快速压缩候选池”
  • 任何人工校正都会成为瓶颈

于是,LLM 的“概率压缩能力”反而成为优势:

  • 不是精确挑选,而是“抽样优先级”
  • 不是最优解,而是“足够好的候选集合”

评论甚至有些讽刺地指出:在这种机制下,35% 的命中率已经被视为“很高效率”。[1]

这意味着招聘正在从“判断问题”变成“抽样问题”。


为什么这个话题在技术社区爆火?

1. 黑箱系统的不安感

LLM + ATS 的组合,本质上是一个不可解释系统:

  • 你不知道简历被如何理解
  • 你不知道评分依据权重
  • 你甚至不知道“失败”是否稳定复现

这种不透明性,在招聘这种强依赖公平感的领域,会迅速放大焦虑。

HN 评论中反复出现一个情绪点:

简历像是被丢进 LLM 黑洞,然后消失了。[1]

这种说法虽然夸张,但精准表达了一种现实体验:反馈缺失 + 决策不可解释


2. “随机性歧视”的隐性担忧

另一个讨论焦点来自结构性偏差问题。

有评论指出,LLM 打分机制往往会给:

  • 开源贡献
  • 个人项目
  • 技术博客

更高权重。[1]

问题在于,这些指标并不“纯粹技术”:

  • 有时间资源的人更容易积累
  • 有经济条件的人更容易参与开源
  • 没有多重工作负担的人更容易构建作品集

于是系统看似中立,实际可能在放大一种隐性筛选:

更偏向“有充足时间投入技术的人”

这让技术筛选从“能力竞争”滑向“生活条件竞争”。


3. AI 加速了招聘的“极端规模化”

另一个被频繁提到的现实是:投递数量正在爆炸式增长。

  • 求职者用 AI 批量投递
  • 企业用 AI 批量筛选
  • 双方都在提高“吞吐量”

结果是:

  • 简历数量上涨
  • 人工注意力下降
  • 系统必须更依赖自动评分

这形成了一个反馈循环:

AI 越普及 → 简历越多 → ATS 越依赖 AI → 随机性越高


ATS + LLM 的本质:在不可能中做近似

为什么“确定性筛选”正在失效

从系统设计角度看,这一变化并不是偶然,而是规模约束下的必然结果。

当输入规模超过人类处理能力时:

  • 精确排序成本过高
  • 人工评估不可扩展
  • 规则系统无法覆盖复杂背景

于是 LLM 被引入作为“近似函数”:

  • 压缩信息
  • 生成评分
  • 提供排序建议

但近似本身就意味着误差,而误差在概率系统中表现为:

  • 波动
  • 不稳定
  • 偶然性

随机性不是 bug,而是结构特性

很多人本能地把这种不确定性视为系统缺陷,但从模型角度看,它是结构必然:

  • LLM 是概率模型
  • ATS 需要压缩高维信息
  • prompt 和上下文存在微扰

三者叠加后,不稳定输出几乎不可避免。

甚至可以说:

ATS 的“随机性”,是大规模语义压缩的副作用。


对开发者的影响:你正在进入“概率竞争系统”

1. 简历优化从“写对”变成“提高抽样概率”

过去优化简历是:

  • 关键词匹配
  • 经验表达清晰

现在变成:

  • 提高被模型“选中”的概率
  • 增加可被解释的信号密度
  • 在多个评分维度上重复出现“强特征”

这更像是在训练一个分类器,而不是写文档。


2. “一次投递”不再是有效策略

在高随机系统中:

  • 单次结果意义下降
  • 多次采样更接近真实分布
  • 时间点变得敏感

这解释了为什么一些候选人会观察到:

同一简历,早投和晚投结果不同

本质原因是:系统状态 + 输入顺序 + 负载波动共同影响输出。


3. 职业筛选正在向“老虎机模型”靠拢

HN 评论里那句半开玩笑的话其实很关键:

不如直接随机扔掉一半简历。[1]

这句话虽然极端,但反映了一个现实趋势:

当系统无法稳定区分候选人时,随机性本身就成为一种“负载均衡机制”


结语:当招聘变成概率游戏

LLM 驱动的 ATS 并没有让招聘变得更“聪明”,它只是让原本就存在的复杂性被数学化、概率化。

在这个新系统中:

  • 优秀 ≠ 一定通过
  • 不通过 ≠ 不优秀
  • 通过 ≈ 被抽样选中

这不是算法失控,而是规模压力下的结构结果。

真正值得关注的变化不是“AI 是否公平”,而是:

当筛选不可解释时,求职行为本身会不会变成一种概率博弈?

而在这个博弈里,所有人都在同一个分布中竞争,只是有人抽得更早,有人抽得更多次。


参考来源

[1] Hacker News 讨论:HackerRank open sourced its ATS. My resume scored 90/100. Oh wait 74. No – 88
https://news.ycombinator.com/item?id=48713832