最反直觉的数学定理：1万多人专门写信反驳世界上智商最高的人，他们全错了

图片来源：unsplash+

撰文 | 王昱

审校 | 不周

想象你正在参加一个电视节目。你面前有三扇门，一扇门后面是汽车，另外两扇门后面是山羊。如果你选中那扇有汽车的门，就能赢得汽车。

你先选了一扇门。但就在开奖前，主持人告诉你他知道汽车在哪扇门的后面，他打开了一扇你没选的门，那扇门后面是一只山羊。然后他给了你一次机会：“要不要把选择换成另一扇没有打开的门？”

大多数人的第一反应是，现在只剩下两扇门了，一扇有车，一扇没车，概率应该都是50%，没必要换。

如果你也这么认为，那你就落入了三门问题的陷阱，这可能是最知名且最违反直觉的数学问题之一。正确的答案是应该换，因为换门后赢的概率是2/3，不换只有1/3。

这个问题的出处很多。比如《科学美国人》1959年曾刊登过本质上相同的囚犯问题。但三门问题最知名的版本来自美国电视游戏节目《一锤定音》（Let’s Make a Deal）。这档节目1963年12月30日首播，60到70年代由蒙提·霍尔（Monty Hall）主持，常让选手在几扇门和隐藏奖品之间做选择。所以在英文世界中，三门问题也叫蒙提·霍尔问题（Monty Hall problem）。

1990年，美国畅销杂志Parade在专栏中介绍了这个问题。专栏作者玛丽莲·沃斯·萨万特（Marilyn vos Savant，吉尼斯世界纪录IQ最高保持者）写道：应该换门，中奖概率会从1/3变成2/3。结果引来了大约1万封读者来信，纷纷反驳她的答案，其中不乏来自博士或来自数学研究者的来信。就连知名数学家保罗·埃尔多斯（Paul Erdos）也不相信这个答案——直到计算机模拟证明：确实应该换门。

反直觉的概率

所以究竟是怎么回事？

你最开始选中汽车的概率只有1/3，有2/3的概率汽车在剩下两扇门里。关键在于，主持人知道汽车在哪扇门后面，他其实是帮你排除了一扇错误的门，于是剩下两扇门2/3的概率都集中在了最后一扇门上。

或者可以换一种解释：不换门能赢，只有一种情况，就是你一开始就选中了汽车，概率1/3；换门能赢，则发生在你一开始选中山羊的时候，概率2/3。主持人知道答案，所以他帮你开门这件事，能带来额外的信息量，让你实现更高的胜率。

参赛者最初选择时有1/3的相同概率选择汽车、A羊和B羊，转换后的获胜概率为2/3。图片来源：wikipedia

如果你还是想不明白的话，可以用数学家帮你总结出来的终极杀招：贝叶斯定理。这是一个著名的概率公式，能告诉我们如何利用过程中获得的信息。

贝叶斯定理是关于随机事件A和B的条件概率的一则定理：

P(A|B) = P(B|A)·P(A) / P(B)

其中A和B都是随机事件，P(A)和P(B)分别是事件A、事件B发生的概率，P(A|B)是事件B发生的情况下事件A发生的概率，P(B|A)是事件A发生的情况下事件B发生的概率。

提示：如果对数学过敏可以直接划到下一个小标题。

在三门问题中，假如三扇门编号分别为1、2、3，假如你最开始选择了1号门，主持人打开了2号门，2号门后面是一只山羊，那么这时汽车在1号门后的概率应该这样计算：

P(1号门后是汽车|主持人打开2号门) = P(主持人打开2号门|1号门后是汽车)·P(1号门后是汽车) / P(主持人打开2号门)

让我们一项一项分析这个公式。

P(主持人打开2号门|1号门后是汽车)的意思是，1号门后是汽车的情况下，主持人打开2号门的概率。主持人这时可以开2号门，也可以开3号门。他随机选一扇开，打开2号门的概率是1/2。

P(1号门后是汽车)是1号门后是汽车的概率，作为独立概率，他的答案很简单，就是1/3。

P(主持人打开2号门)则比较复杂，要考虑汽车在1、2、3号门背后的情况。如果汽车在1号门后，那么情况就变成了P(主持人打开2号门|1号门后是汽车)，概率为1/2；如果汽车在2号门后，主持人不可能打开这扇背后有汽车的门，概率为0；如果汽车在3号门后，主持人只能打开2号门，因为他只能从2、3号门中打开一扇，但又不可能打开背后是汽车的3号门，所以概率为1。这三种情况每种情况发生的概率为1/3，加起来总概率是1/2。

代入公式，我们就能知道P(1号门后是汽车|主持人打开2号门) = 1/3。所以应该换门。

失准的感觉

在涉及检测的问题里，贝叶斯定理尤其重要。

假设一种疾病在人群中的患病率是千分之一。现在有一个非常厉害的检测：真正患病的人里，99%会被测出来；没有患病的人里，只有1%会被误报。

所以，如果一个人测出了阳性，那他得病的概率是多少呢？

直觉上，似乎这说明这个人应该是得病了，毕竟检测准确率高达99%。

但如果认真算一下，你就会发现情况并不是这样。假设现在有1000个人，其中有1个患病。这个患病的人检测结果大概率是阳性。而剩下的999个健康人，由于检测有1%的误报率，大约有10人会产生假阳性。因此，预计会有11例阳性的结果，其中有1例真阳性和10例假阳性。所以哪怕检测结果为阳性，真正的患病概率也只有1/11。（理论计算结果有细微偏差，但大致就是这样）

这在医学检测上被称为假阳性悖论。我们之所以产生这种错觉，在很大程度上是因为，当我们在用独立事件的概率来判断事情发生的概率时，却很容易忽视世界上充满了极易被忽略的前置条件。

概率偏见

2022年末到2023年初ChatGPT的爆火带来了一个问题，用它来写小论文实在是太简单了，于是论文查重工具纷纷给自己添加了AI检测功能。比如当时论文检查工具Turnitin就宣称，他们的误报率可以低至1%。

但当年8月，美国范德堡大学官方公告，他们决定禁用Turnitin的AI生成检测功能。因为范德堡大学每年大约会提交75 000篇论文，即便只有1%的误报率，可能也有750篇学生论文被误会。这对应750次可能怀疑、申辩、成绩扣留，甚至学术诚信调查。范德堡大学认为，在现阶段禁用AI生成检测功能，是维护师生利益的最佳考量。

到2026年，Turnitin自己的官方指南也在提醒，不应将AI写作报告作为对学生采取不理行动的唯一依据。它的模型可能误判人类写作，也可能漏掉AI写作。2024年起，Turnitin还把1%到19%的低分区间隐藏成星号，不再显示具体分数，原因之一就是这个区间更容易被误读。

所以，在面对一个哪怕准确率高达99%的结果时，先别急着相信，也别急着否定。一个证据有多重要，取决于它来之前，世界原本是什么样子。

参考链接：
《贝叶斯定理》，汤姆·奇弗斯，中信出版集团
https://www.scientificamerican.com/blog/observations/lets-make-a-deal-revisiting-the-monty-hall-problem/
https://www.nationalgeographic.com/science/article/pigeons-outperform-humans-at-the-monty-hall-dilemma
https://en.wikipedia.org/wiki/Bayes%27_theorem
https://www.vanderbilt.edu/brightspace/2023/08/16/guidance-on-ai-detection-and-why-were-disabling-turnitins-ai-detector/
https://guides.turnitin.com/hc/en-us/articles/22774058814093-Using-the-AI-Writing-Report

最反直觉的数学定理：1万多人专门写信反驳世界上智商最高的人，他们全错了

作者环球科学

作者环球科学

相关文章

印度进入地狱模式，温度冲上47度，全球50个最热城市全在印度

如果你是意大利科学家，黑手党也可以是研究对象

模拟2000次文明的结局后，天文学家找到了地球文明崩溃的前兆

暗物质失踪现场 | 《环球科学》新刊导读

AI协作时代 | 《环球科学》新刊导读

意识的理论危机 | 《环球科学》新刊导读

机器人走入日常生活？ | 《环球科学》新刊导读

《环球科学》新刊导读202601

作者环球科学

作者 环球科学

相关文章

作者环球科学