
图片来源:unsplash+
撰文 | 王昱
审校 | 不周
想象你正在参加一个电视节目。你面前有三扇门,一扇门后面是汽车,另外两扇门后面是山羊。如果你选中那扇有汽车的门,就能赢得汽车。
你先选了一扇门。但就在开奖前,主持人告诉你他知道汽车在哪扇门的后面,他打开了一扇你没选的门,那扇门后面是一只山羊。然后他给了你一次机会:“要不要把选择换成另一扇没有打开的门?”
大多数人的第一反应是,现在只剩下两扇门了,一扇有车,一扇没车,概率应该都是50%,没必要换。
如果你也这么认为,那你就落入了三门问题的陷阱,这可能是最知名且最违反直觉的数学问题之一。正确的答案是应该换,因为换门后赢的概率是2/3,不换只有1/3。
这个问题的出处很多。比如《科学美国人》1959年曾刊登过本质上相同的囚犯问题。但三门问题最知名的版本来自美国电视游戏节目《一锤定音》(Let’s Make a Deal)。这档节目1963年12月30日首播,60到70年代由蒙提·霍尔(Monty Hall)主持,常让选手在几扇门和隐藏奖品之间做选择。所以在英文世界中,三门问题也叫蒙提·霍尔问题(Monty Hall problem)。
1990年,美国畅销杂志Parade在专栏中介绍了这个问题。专栏作者玛丽莲·沃斯·萨万特(Marilyn vos Savant,吉尼斯世界纪录IQ最高保持者)写道:应该换门,中奖概率会从1/3变成2/3。结果引来了大约1万封读者来信,纷纷反驳她的答案,其中不乏来自博士或来自数学研究者的来信。就连知名数学家保罗·埃尔多斯(Paul Erdos)也不相信这个答案——直到计算机模拟证明:确实应该换门。
反直觉的概率
所以究竟是怎么回事?
你最开始选中汽车的概率只有1/3,有2/3的概率汽车在剩下两扇门里。关键在于,主持人知道汽车在哪扇门后面,他其实是帮你排除了一扇错误的门,于是剩下两扇门2/3的概率都集中在了最后一扇门上。
或者可以换一种解释:不换门能赢,只有一种情况,就是你一开始就选中了汽车,概率1/3;换门能赢,则发生在你一开始选中山羊的时候,概率2/3。主持人知道答案,所以他帮你开门这件事,能带来额外的信息量,让你实现更高的胜率。

参赛者最初选择时有1/3的相同概率选择汽车、A羊和B羊,转换后的获胜概率为2/3。图片来源:wikipedia
如果你还是想不明白的话,可以用数学家帮你总结出来的终极杀招:贝叶斯定理。这是一个著名的概率公式,能告诉我们如何利用过程中获得的信息。
贝叶斯定理是关于随机事件A和B的条件概率的一则定理:
P(A|B) = P(B|A)·P(A) / P(B)
其中A和B都是随机事件,P(A)和P(B)分别是事件A、事件B发生的概率,P(A|B)是事件B发生的情况下事件A发生的概率,P(B|A)是事件A发生的情况下事件B发生的概率。
提示:如果对数学过敏可以直接划到下一个小标题。
在三门问题中,假如三扇门编号分别为1、2、3,假如你最开始选择了1号门,主持人打开了2号门,2号门后面是一只山羊,那么这时汽车在1号门后的概率应该这样计算:
P(1号门后是汽车|主持人打开2号门) = P(主持人打开2号门|1号门后是汽车)·P(1号门后是汽车) / P(主持人打开2号门)
让我们一项一项分析这个公式。
P(主持人打开2号门|1号门后是汽车)的意思是,1号门后是汽车的情况下,主持人打开2号门的概率。主持人这时可以开2号门,也可以开3号门。他随机选一扇开,打开2号门的概率是1/2。
P(1号门后是汽车)是1号门后是汽车的概率,作为独立概率,他的答案很简单,就是1/3。
P(主持人打开2号门)则比较复杂,要考虑汽车在1、2、3号门背后的情况。如果汽车在1号门后,那么情况就变成了P(主持人打开2号门|1号门后是汽车),概率为1/2;如果汽车在2号门后,主持人不可能打开这扇背后有汽车的门,概率为0;如果汽车在3号门后,主持人只能打开2号门,因为他只能从2、3号门中打开一扇,但又不可能打开背后是汽车的3号门,所以概率为1。这三种情况每种情况发生的概率为1/3,加起来总概率是1/2。
代入公式,我们就能知道P(1号门后是汽车|主持人打开2号门) = 1/3。所以应该换门。
失准的感觉
在涉及检测的问题里,贝叶斯定理尤其重要。
假设一种疾病在人群中的患病率是千分之一。现在有一个非常厉害的检测:真正患病的人里,99%会被测出来;没有患病的人里,只有1%会被误报。
所以,如果一个人测出了阳性,那他得病的概率是多少呢?
直觉上,似乎这说明这个人应该是得病了,毕竟检测准确率高达99%。
但如果认真算一下,你就会发现情况并不是这样。假设现在有1000个人,其中有1个患病。这个患病的人检测结果大概率是阳性。而剩下的999个健康人,由于检测有1%的误报率,大约有10人会产生假阳性。因此,预计会有11例阳性的结果,其中有1例真阳性和10例假阳性。所以哪怕检测结果为阳性,真正的患病概率也只有1/11。(理论计算结果有细微偏差,但大致就是这样)
这在医学检测上被称为假阳性悖论。我们之所以产生这种错觉,在很大程度上是因为,当我们在用独立事件的概率来判断事情发生的概率时,却很容易忽视世界上充满了极易被忽略的前置条件。
概率偏见
2022年末到2023年初ChatGPT的爆火带来了一个问题,用它来写小论文实在是太简单了,于是论文查重工具纷纷给自己添加了AI检测功能。比如当时论文检查工具Turnitin就宣称,他们的误报率可以低至1%。
但当年8月,美国范德堡大学官方公告,他们决定禁用Turnitin的AI生成检测功能。因为范德堡大学每年大约会提交75 000篇论文,即便只有1%的误报率,可能也有750篇学生论文被误会。这对应750次可能怀疑、申辩、成绩扣留,甚至学术诚信调查。范德堡大学认为,在现阶段禁用AI生成检测功能,是维护师生利益的最佳考量。
到2026年,Turnitin自己的官方指南也在提醒,不应将AI写作报告作为对学生采取不理行动的唯一依据。它的模型可能误判人类写作,也可能漏掉AI写作。2024年起,Turnitin还把1%到19%的低分区间隐藏成星号,不再显示具体分数,原因之一就是这个区间更容易被误读。
所以,在面对一个哪怕准确率高达99%的结果时,先别急着相信,也别急着否定。一个证据有多重要,取决于它来之前,世界原本是什么样子。
参考链接:《贝叶斯定理》,汤姆·奇弗斯,中信出版集团
https://www.scientificamerican.com/blog/observations/lets-make-a-deal-revisiting-the-monty-hall-problem/
https://www.nationalgeographic.com/science/article/pigeons-outperform-humans-at-the-monty-hall-dilemma
https://en.wikipedia.org/wiki/Bayes%27_theorem
https://www.vanderbilt.edu/brightspace/2023/08/16/guidance-on-ai-detection-and-why-were-disabling-turnitins-ai-detector/
https://guides.turnitin.com/hc/en-us/articles/22774058814093-Using-the-AI-Writing-Report
