本文是《普通人如何评估 AI 的智能水平?一个贝叶斯视角》的补充说明,专门把原文里偏数学/偏理论的部分拆出来,用更口语化但尽量严谨的方式解释。

1. 你真正想问的问题是什么?

你在原文里看到的“贝叶斯”,本质上是在回答一句话:

放到 AI 评估里,就是:

2. 先别急着被“惊艳”带走:两类世界

为了说清楚,我们把世界简单分成两类:

  1. AI 真的懂(有比较稳定的理解与能力)
  2. AI 并不真的懂(主要是在做模式匹配、拼凑出“像是对的”内容)

现实当然更复杂,但先这样拆开,你会更容易看清推理结构。

3. 什么叫“基率”?为什么它总被忽略?

“基率”可以理解为:在你看到任何新证据之前,这件事本来发生的比例。

比如:

人脑的惯性是:一旦看见一个“很像”的描述或一次“很强”的表现,就立刻把结论坐实。

但正确做法是:先把“本来就不常见/不太可能”的那层背景放进来。

4. 似然:在两类世界里,这种现象分别有多常见?

接下来才轮到“这次表现”本身。