成都布克购书中心店铺主页二维码
成都布克购书中心 微信认证
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

中信出版 | 贝叶斯定理:清晰思考与决策的科学工具

69.10
运费: ¥ 0.00-15.00
库存: 444 件
中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品图0
中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品图1
中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品图2
中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品缩略图0 中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品缩略图1 中信出版 | 贝叶斯定理:清晰思考与决策的科学工具 商品缩略图2

商品详情


书名: 贝叶斯定理

定价: 79.00

作者: 汤姆·奇弗斯

出版社: 中信出版集团

出版日期: 2025-04-02

页码: 360

装帧: 平装

开本: 16

ISBN: 9787521773125


1. ​颠覆认知的“万物理论”​
贝叶斯定理以简洁公式揭示复杂世界的不确定性规律,从医学检测到AI决策,从法庭证据到科学实验,重新定义我们对概率的认知。
2. ​跨学科的实用指南
​医学决策:揭秘癌症筛查误诊率真相,解读新冠检测数据背后的逻辑。
​法律与AI:剖析“检察官谬误”,展示DNA证据的局限性;拆解ChatGPT等AI技术的底层贝叶斯逻辑。
​日常生活:用三门问题、超能力谣言等案例,教会读者理性应对信息陷阱。
3. ​历史与科学的双重叙事
​传奇人物群像:从牧师贝叶斯到统计学家费希尔,还原定理诞生背后的思想交锋与人性故事。
​科学革命现场:重现“可重复性危机”等现代科学困局,揭露p值滥用如何导致研究结论失真。
4. ​大脑与认知的极解码
​神经科学突破:用贝叶斯原理解释视错觉、致幻剂体验,提出“大脑是贝叶斯预测机器”的颠覆理论。
​精神疾病新解:探讨精神分裂症患者为何无法自我挠痒痒,展现意识形成的数学本质。
5. ​写给普通人的硬核科普
​零公式恐惧:作者以自嘲式幽默消解数学门槛,用扑克牌、赌局等生活场景化解抽象概念。
​时代共鸣:结合新冠疫情检测争议、阴谋论传播等热点,提供对抗信息泛滥的思维武器。
一个诞生于200多年前的数学定理,为什么能在漫长的时间里改变医学、法律、科研、人工智能等多个领域,并成为个人理性思考和决策的强大工具?

这正是贝叶斯定理的魅力所在。它不仅仅是一个数学公式,更是一种帮助我们在不确定性中寻找答案的思维方法。当体检报告出现异常指标时,它帮助你理性评估是否需要进一步检查;当需要对重要事实做出判断时,它教你如何权衡各种证据;在人工智能时代,它甚至是许多智能算法背后的核心原理。

本书以生动活泼的笔调,通过引人入胜的故事和案例,展示了这个源自18世纪长老会牧师托马斯·贝叶斯的研究如何产生深远影响。贝叶斯定理将帮助你学会区分相关性和因果关系,避免常见的认知偏差和决策陷阱,在纷繁复杂的信息中提取真正有价值的内容。即使没有任何数学基础,书中的真实案例分析和实践指南也能让你轻松掌握这套思维方法。

在信息爆炸的时代,拥有一个可靠的思维框架比任何时候都重要。让我们一起走进贝叶斯的世界,在这个充满不确定性的时代,找到属于自己的确定性,在复杂中保持清醒。
引言 一个近乎于 “万物理论” 的理论

一章 从《公祷书》到《蒙特卡罗六壮士》
 托马斯・贝叶斯
 帕斯卡与费曼
 大数定律
 亚伯拉罕・棣莫弗与正态分布
 辛普森与贝叶斯
 贝叶斯的 “台球” 比喻
 理查德・普莱斯,世上一位贝叶斯主义者,试图将上帝从大卫・休谟的手中拯救回来
 从贝叶斯到高尔顿
 高尔顿、皮尔逊、费希尔与频率学派的兴起
 频率学派涉嫌种族歧视?
 贝叶斯主义的衰落
 统计显著性
 贝叶斯理论岌岌可危?
 “我双眼已见证,概率之神托马斯・贝叶斯牧师的荣耀”

第二章 科学中的贝叶斯思想
 可重复性危机及应对方案
 奶酪做的月亮、超能力、超光速粒子
 卡尔・波普尔和他的 “天鹅理论”
 贝叶斯理论与可重复性危机
 丹尼斯・林德利悖论
 如何确定你的先验概率
 你并不是在白费力气,你只是尚未成功

第三章 决策论中的贝叶斯思想
 亚里士多德与乔治・布尔
 贝叶斯理论是决策论的核心思想
 克伦威尔法则
 意料之中的证据
 效用、博弈论、荷兰赌
 奥卡姆剃刀与先验概率
 超先验
 非此即彼的假说&多个假说
 AI 中的贝叶斯思想

第四章 生活中的贝叶斯思想
 人类是理性的吗?
 人们对 “三门问题” 的误解
 超级预测者(一部分)
 超级预测者(第二部分)
 贝叶斯认识论

第五章 贝叶斯式的大脑
 从柏拉图到格里高利
 视错觉
 真实只是一种 “受控的幻觉”?
 多巴胺与 “复杂的计算装置”
 网球、猜词游戏、“眼跳”
 为什么精神分裂症患者可以自己挠自己的痒痒?
 你有没有认认真真、仔仔细细地看过自己的手?
 上帝保佑!

总结 贝叶斯式的生命
致谢
汤姆·奇弗斯(Tom Chivers)
著名科普作者、出版人,他擅长解释复杂理论在日常生活中的实际应用,因而成为了科学写作领域广受欢迎的作家之一。2018年、2020年两次获得皇家统计学会卓越奖;2021年荣获英国科学作家协会的年度科学记者奖。
尹烨(华大集团 CEO,生物学博士)
生物学研究的本质,就是在混沌中寻找规律。我加入华大后,因为开发诊断试剂而深度应用的一个统计工具,就是贝叶斯公式。以先验为基,循数据之变,进而验得新知,生生不息,这就是贝叶斯方法。它不仅是一个计算工具,更是一种思维方式——在不确定的世界里,拥抱贝叶斯思维,就是拥抱一种持续演化、自我修正的智慧。它教会我们如何诚实地对待科学中的未知,并在证据积累中不断逼近生命的真相。

李永乐(知名科普创作者)
贝叶斯定理不仅是一串公式,更是理性对抗不确定性的思维脚手架。《贝叶斯定理》通过直观生动的科普,将抽象公式还原为可操作的思维工具。你会发现,医生误诊率计算、投资决策优化甚至刑事司法中的证据评估,本质上都是贝叶斯推理的实战演练。书中巧妙拆解了“先验偏见”如何扭曲判断(比如仅凭症状直接诊断疾病却忽略基础发病率),又用“反概率”思维带我们透过现象看本质,正如休谟所言“因果律只是经验的重复”,而贝叶斯定理正是量化不确定性的科学锚点。掌握这本书,就像获得了用数学驯服混沌的瑞士军刀。

万维钢(科学作家,得到 App《精英日课》专栏作者)
贝叶斯定理是整个社会科学中非常有用的公式,也是现代高效能人士的神兵利器。我对它的应用已经知道很多,但奇弗斯的这本书仍然让我赞叹。
简单来说,贝叶斯定理是这么一种精神,也是一个方法论:你的决策应该基于量化指标而不是某种直觉;这个量化指标须是基于已知好的信息,并且能够根据信息的更新而改变;它改变的幅度须是合理的,不能一惊一乍,动不动就从一个端走向另一个端。贝叶斯定理不能让你未卜先知,但我们能追求的不是每个决策都正确,而是一个正确的决策系统。有了这个系统,你做出正确决策的可能性会明显大于做出不正确决策的可能性,你会在长期获得巨大的正向收益。
不要被书中的计算吓倒,那只不过是简单的乘除而已。但你的确需要见微知著的智能才能领悟其中的智慧,这本书可以帮你训练这种智能。

檀林(北京大学汇丰商学院创业实践导师)
现代社会的复杂性要求我们同时具备两种能力:用贝叶斯定理构建动态决策模型,用斯多葛哲学锻造心理免疫系统。当我们将数学理性与哲学智慧熔铸为思维本能时,就既能像导航系统般精准调整人生方向,又能如充电宝般保持内在能量的稳定续航。这种“动态灵活 + 内在稳定”的复合思维模式,正是应对不确定性时代的极生存策略。
引言 一个近乎“万物理论”的理论

精神病学领域有一条通用准则:如果你认为自己找到了可 以解释万物的极理论, 那你应该是患上了妄想症,快去医院 看看吧。

—斯科特·亚历山大

我们能预测未来吗?当然可以! 可以肯定的是,接下来的几秒钟内你然会吸进一口气,再把 它呼出去。你还可以自信地预测,你的心脏会继续跳动,每秒一到 三下;明早太阳会照常升起,尽管具体时刻取决于你所处的纬度和 时节,但精准的数据并不难找。

你还可以预测火车到站的时间,预测你的朋友会准时抵达事先 说好的饭店,尽管你在做出这些预测时的自信程度会受到具体是哪 家铁路公司、哪位朋友的影响。

此外你还可以预测,世界人口将持续增长至 21 世纪中叶,然后开始下降;2030 年的全球平均地表温度将高于 1930 年。

未来并非无法窥测,我们有能力拨开迷雾一探究竟。有些东西 很好预测,比如根据传统力学预测几千年之内的行星轨迹;有些东 西则很难预测, 比如在混沌理论的背景下预测天气——能预测几天 就很了不起了。但不管怎么说,我们总能掀开帷幔,或多或少地看 到一些未来。

大众口中的“预测未来”通常指的是一些极为神秘的、 涉及 超自然力量的、神一般的预言。但本书提到的“预测未来”并不是 这个意思,我们很难有这种通天之术(后文会提到一位科学家,他 认为我们的确有这种能力,读完之后你就会明白,他肯定是错的)。 事实上,我们根本不需要那种夸张的能力就能做出预测。我们这一 生从来就没有停止过对未来的预测,预测和生命是密不可分的。有 些预测是很基本的,比如每次吸气时,我们都会下意识地预测“空 气一直是可吸入的”。 有些预测是较为复杂的, 比如“街角的商店 里会有欧倍牌麦片,我走进去就能买到”,每个决策都伴随着类似的 预测。我们做出这些预测并非基于超能力,而是基于我们的经验。

有预测都存在一个问题,即结果的不确定性。我们不清楚这 个世界到底是建立在决定论之上的, 还是建立在非决定论之上的。 倘若我们可以像全知能的上帝一样,知晓宇宙中每个粒子的位置、 动量、性质,那我们或许就能美地预测世间万物,比如每只麻雀 的死亡 1 。可惜我们并非全知能,我们能够掌握的信息很有限 2 。 我们没有美的感知能力,所以我们无法看到宇宙的每个细节,但 我们可以利用有限的信息做出不美的预测,比如我们可以大体预 测出不同事物的活动方式:像人一样的事物会倾向于寻找食物、组建团队,像岩石一样的事物往往只能静止不动。 生命不是一局国际象棋,而是一场扑克游戏,因为前者的信息 是完全的,理论上我们可以“应对”任何状况;而后者的信息是有 限的,我们只能尽量根据掌握的信息做出佳决策。

本书的主要内容就是帮你学会做出佳决策的“公式”。

《时间简史》出版之后,史蒂芬·霍金曾说过这样一句话:“有人 对我说,书里每多出一个公式,它的销量就会减少一半。” 2 可我这本书的核心内容就是一个公式,想要一个公式都没有也太困难了。1

这个公式就是著名的贝叶斯定理,它是一个极为简洁的等式:


说来实在惭愧,其实我也讨厌看到数学公式。虽然硬要我去使 用公式的话,我也不是做不到,但我实在感到乏味无趣。可你知道 吗,尴尬的是,虽然我已经写了 3 本书,且每本书都和数学密切 相关, 但在看到 Σ 这个符号的时候, 我的大脑仍会频频宕机。 我 想大多数读者都和我有着类似的感受,这或许就是出版社警告霍金 尽量不要在书中列出公式的原因。

不过我们也没要谈方程色变,方程并不是什么晦涩难懂的咒 语或密码,它只是一种简便的书写方式,每个小符号都代表一个简 单的步骤(我常常这样安慰自己)。

贝叶斯定理也是如此,它只是一个概率公式,它可以根据已知信息算出某件事发生的概率。具体来说,它是一种条件概率。公式中的 竖线“|”是“在此情况下”或“以此为前提条件”的简写, P(A |B) 则指的是“在事件 B 已经发生的情况下,事件 A 发生的概率”。

这里我们给出一个条件概率的简例。你手中有一副去掉大小王 的扑克牌,你想知道从中抽到红桃的概率。已知扑克牌一共有 52 张, 红桃有 13 张, 我们可以据此算出其概率——记作 P( )——等于 13/52, 或 1/4, 用数学语言表示就是 p=0.25。 然后我们假定你抽了 一张牌,是梅花,那么此时抽到红桃的概率是多少呢?我们知道牌 堆中仍然有 13 张红桃, 但牌的总数变成了 51, 所以此时概率变成 了 13/51,或者说 p ≈ 0.255。这就是你已经抽出一张梅花的情况下, 再抽到一张红桃的概率,即 P( | )。

再举一例:伦敦某天下雨的概率是多少?答案是 0.4 左右, 因 为伦敦每年大约有 150 天在下雨。现在你往窗外瞥了一眼,发现乌 云密布,那么此时下雨的概率是多少?我也不知道确切答案,但我 知道,阴天下雨的概率肯定更高。

贝叶斯定理其实也是这个意思,只不过它的适用场景更为广泛。 用通俗的语言来解释公式的四个部分, 就是这个样子:(事件 B 已 经发生的情况下, 事件 A 发生的概率)=(事件 A 已经发生的情况 下,事件 B 发生的概率)×(事件 A 单独发生的概率)÷(事件 B 单独发生的概率)。

现在假设我们的社会出现了一种大规模传播的疾病(可以参考 刚刚经历的新冠疫情)。

为了弄清自己到底有没有染上这种病, 你做了一个测试。测试的指导手册上写着这样一句话:“本测试的灵敏度和特异度均为 99%。”也就是说, 如果你真的染上了这种病, 那么这个测试有 99% 的概率可以准确地告诉你,你确实染上了这种病;如果你没有 染上这种病, 那么它也有 99% 的概率可以准确地告诉你, 你没有 染上这种病。另外我们还可以这样理解:该测试的“假阴性率”和 “假阳性率”都是 1%。

现在假定你的试纸上出现了两条红线,也就是说测试结果呈阳 性。 这意味着什么呢?你可能会自然而然地认为, 自己有 99% 的 概率被传染了。

但贝叶斯定理会告诉我们,事实并非如此。

贝叶斯定理是一个非常奇怪的定理。它的表达式十分简洁,写 出来不占什么篇幅,涉及的运算只有乘法和除法,就连 8 岁小孩都 会算。 它的提出者也只是一个生活在 18 世纪的普通富绅, 这位富 绅白天会在坦布里奇韦尔斯担任牧师,但他并不信奉英格兰国教1 , 研究数学也只是业余爱好。 尽管如此, 贝叶斯定理仍旧产生了极 为深远的影响——它可以解释为什么即便癌症测试呈阳性的人中有 99% 都没有癌症, 测试的准确率仍然可以高达 99%;为什么 DNA (脱氧核糖核酸)鉴定只有两万分之一的概率匹配错人, 但它仍 有很大概率导致冤假错案;为什么一个科学结论明明具有“统计显 著性”,但它仍旧有很大概率是错的。

贝叶斯定理还涉及迷人的哲学思辨。“概率”是真实存在的 吗?我们说掷色子有六分之一的概率掷出 1,这到底是什么意思?它是宇宙中确切存在的事实, 还是我们对这个世界所持有的一种信 念?一次性事件也有概率吗?如果我告诉你, 曼城队有 90% 的概 率成为 2025 年的英超冠军,那这到底意味着什么呢?

每次我们面对不确定的事物做出决策时—— 一直以来我们都是 这样做的——都可以利用贝叶斯定理来判断该决策在多大程度上算 是个好决策。事实上,无论是怎样的决策过程,无论你为了实现某 个目标对世界产生了多大的影响,无论你掌握的信息多么有限,无 论你是正在寻找高浓度葡萄糖环境的细菌,是正在利用复制行为传 播遗传信息的基因,还是正在努力实现经济增长的政府,只要你想 把事情干好,你就离不开贝叶斯定理。

AI(人工智能)本质上也是贝叶斯定理的一个具体应用。 从 基本的层面来说,AI 所做的事情就是“预测”。 一个可以分辨 猫狗图像的 AI 应用, 本质上就是在根据过往的训练数据和当前 的图像信息去“预测”人类对图片的判断。DALL-E 2、GPT-4、 Midjourney 等各种优秀的 AI 应用, 正在以令人应接不暇的速度一 次次冲击人们的认知,我写下这段话的时候可能就刚好有一个震撼 世界的 AI 应用横空出世。 不过, 这些和你谈笑风生、 为你生成高 质量图像的 AI,本质上也是在做预测,只不过它们预测的是人类作 家、人类艺术家面对这些提示词时会如何作答。这些预测行为的基 础都是贝叶斯定理。

大脑的工作也离不开贝叶斯定理,这就是人类容易产生视错觉、 致幻剂可以致幻的原因,同时也是思想意识的工作原理。

贝叶斯定理可以让我们明白, 为什么阴谋论的观点难以转变; 为什么两个人可以根据同样的证据得出完全相反的结论。比如,为
什么那些科学事实能够让我相信疫苗安全有效,却无法说服一个怀 疑论者呢?答案就是,根据贝叶斯定理,一个人对新信息的判断会 受到既有认知的影响。这并不是说那些怀疑疫苗的人、那些阴谋论 者是大脑运转方式与众不同的外星人,而是说他们也是完全理性的 人,只不过他们的行为建立在固有思想之上。贝叶斯定理可以很好 地解释这一点。

由此可见,虽然贝叶斯定理不是万物理论,但实际上也差不多 了。一旦你开始站在贝叶斯定理的视角去看待问题,你就会发现贝叶 斯定理真的是无处不在。我写这本书的目的就是帮你做到这一点。

通常人们会用医疗检测来解释贝叶斯定理,本书也不例外。这 里我们给出一些比较可靠的数据:假定你正准备进行乳腺癌的筛查 检测,且已经知道,如果某位女性的确患有癌症,那么乳房 X 光在 80% 的情况下可以正确识别出癌症(灵敏度为 80%), 在另外 20% 的情况下会发生漏诊,即假阴性;如果某位女性没有癌症,那么乳 房 X 光在 90% 的情况下可以正确排除癌症(特异度为 90%),在另 外 10% 的情况下会发生误诊,即假阳性。

假定你的检测结果呈阳性, 那是不是说明, 你有 90% 的概率 患上了乳腺癌?不是的。事实是,根据上面给定的这些信息,你根 本无法判断自己患上乳腺癌的概率到底有多大。

你还需要额外掌握一个信息,那就是在参加检测之前,你对自己 患上乳腺癌的概率的预估。简单的预估方式就是找出特定时期内, 与你同龄的女性中的乳腺癌患者的比例。我们假定这一比例为 1%。

为了让案例更加具体,我们进一步假定共有 10 万名女性参加了 检测,那么按照 1% 的患病比例来看,这些人中一共有 1000 名乳腺
癌患者。 在这 1000 名患者当中, 乳房 X 光只能正确检测出 800 名, 另外 200 名将会出现漏诊;剩下的 99000 人没有患乳腺癌, 在这些 健康人当中, 乳房 X 光只能正确判断出 89100 人, 这意味着会有 99000-89100=9900 人被误诊为乳腺癌。下面我们把数据整理成表格:

有乳腺癌 (共 1000 人)

80% (真阳性) 800 人

20% (假阴性) 200 人

没有乳腺癌 (共 99000 人)

检测结果呈阳性

检测结果呈阴性

10% (假阳性) 9900 人

90% (真阴性) 89100 人

现在你明白了吧,得到阳性结果的女性一共有 10700 名,其中 只有 800 人真的患有乳腺癌。换句话说,假定你的测试结果呈阳性, 那么你真正患有乳腺癌的概率是 800/10700 ≈ 0.07,即 7%。

具体结果完全取决于检测前人群中患有乳腺癌者的比例。假如 检测对象是高风险人群,比如具有家族癌症史的老年妇女,那么这 一比例可能高达 10%,此时计算结果会发生翻天覆地的变化。

有乳腺癌 (共 10000 人)

80% (真阳性) 8000 人

20% (假阴性) 2000 人

没有乳腺癌 (共 90000 人)

检测结果呈阳性

检测结果呈阴性

10% (假阳性) 9000 人

90% (真阴性) 81000 人

现在真阳性的人数从 800 涨到了 8000, 假阳性的人数下降 至 9000。 此时一个拿到阳性结果的人真正患乳腺癌的概率变成了 8000/17000,结果约为 47%。知道这一点后,拿到阳性结果的人会 比刚才更加忧虑。整个检测方法没有任何变化,发生变化的只有先 验概率。

换句话说,贝叶斯定理可以告诉你结果的可靠程度。可是要做 到这一点的话,你须对这件事有一个先验预估。

现在我们再来看看这个公式(本书的销量该不会又减半了 吧……毕竟这个公式刚才已经出现过一次)。

经过一系列计算之后, 我们得到的结果就是 P(A|B) , 即事件 B 已经发生的情况下, 事件 A 发生的概率。 癌症检测与之类似, 我 们想知道的是, 在检测结果呈阳性的情况下, 该患者真正患癌的 概率。

可是“灵敏度 80%”并没有给出 P(A|B) , 反而给出了与之相 反的 P(B|A), 即事件 A 已经发生的情况下,事件 B 发生的概率。也 就是说,它可以告诉我们,一个真正患有乳腺癌的人,有多大概率 取得阳性结果。

乍一看好像没什么不同,实际上这两者的区别就像“某个人刚 好是教皇的概率仅有八十亿分之一”和“教皇刚好是个人类的概率 仅有八十亿分之一”的区别一样大。3

为了得到想要的数据,我们需要更多信息。在癌症检测的例子中,我们需要的额外信息是乳腺癌患者在人群中的比例。在医学中, 我们将其称为发病率,或背景发生率;在贝叶斯定理中,这种额外 信息一般被称为先验概率。

医学中的先验概率比较容易获得, 也很容易定义。 比如你想 知道某人患上亨廷顿病的风险,那你可以去查询全科诊所的诊疗记 录 4 ,然后据此算出平均每 10 万人当中约有 12.3 人患有该疾病。

其他情况则要复杂得多。如果几年前你想计算俄乌爆发冲突的 概率,那这个先验概率该怎么算?先算一下俄乌每年爆发冲突的频 次?还是先统计一下有冲突爆发的频次?或是先调查一下,看看 两国边境突然增派大量坦克的时候,双方爆发冲突的概率?

再举一例。 假定我提出了一个科学假说, 做了一次相关实 验,且取得了不错的数据,此时该假说是一个正确假说的概率有多 高?我们进一步假定, 如果该假说是错误的, 那每 20 次实验中只 有 1 次能取得这种数据。这是不是意味着,我的假说大概率是正确 的?不是这样的, 因为它还和另一个概率有关——我开始做实验之 前,该假说为真的概率,即先验概率。可我该上哪儿去搞到这个数 据呢?

法庭辩护中也有一个典案例。 在已经取得某些法庭证据的 情况下, 该嫌疑人有罪的概率是多少?假定嫌疑人的 DNA 恰好出 现在现场的概率只有百万分之一,那是不是说明警察只有百万分之 一的概率抓错了嫌疑人?不是这样的,因为这还取决于一开始警察 就抓到了正确嫌疑人的概率有多大。可问题是,这项数据上哪儿去 找呢?

放心,这些问题本书都会一一作答(有很多数学家研究过相关

10

贝叶斯定理 问题)。 需要牢记的是, 须先得到一个先验概率, 我们才能进一 步应用贝叶斯定理。缺失了先验概率,我们只能得到一些不靠谱的 结论。 大多数人一次听说贝叶斯定理都是在医学领域,所以我们的 旅程也从医学领域开始。

这么多年来, 我逐渐爱上了贝叶斯定理。 一次听说贝叶斯 定理, 是在本·戈尔达克瑞于 21 世纪初在《卫报》上开设的《小 心坏科学!》专栏当中。自那时起,我就对贝叶斯定理越来越着迷。 包括本书在内,我已经出版了 3 部作品,其中每本书都或多或少地 提到了贝叶斯定理。该定理常常能够得出一些反直觉的结论,令人 连连称奇。比如,某项测试的准确率为 99%,并不意味着该测试在 99% 的情况下是正确的。这到底是什么鬼话?虽然只要按部就班地 推导,就能逐渐理解这一事实,但类似的结论总是能够让人感到不 可思议,刷新认知(至少我的感受是这样的)。

过去 4 年当中, 也就是 2020 年初全球暴发新冠疫情之后, 贝 叶斯定理推导出的那些结论变得越来越重要了。早在 2020 年 4 月, 大部分人还处于居家隔离状态的时候,英国前首相托尼·布莱尔等 人就呼吁政府向那些已经得过新冠肺炎、体内已有抗体的人发放免 疫证明,允许他们外出活动(当然这发生在人们意识到各种变异病 毒会导致患者很容易复阳之前)。

抗体测试问世没多久,美国政府就紧急批准了一种抗体检测方 法,该方法的灵敏度和特异度大约都是 95%。5

听上去挺靠谱。事实上,2020 年 4 月,英国大约有 3% 的人口感染了新冠病毒,这一比例就是所谓的先验概率。如果有 100 万人 参加检测,那么其中大约会有 3 万人是新冠肺炎感染者。在这 3 万 名患者当中,会有 28500 人的检测结果呈阳性;剩下的 97 万健康人 当中,则会有 48500 人的结果呈现阳性。

由此可见,在全部 77000 个阳性结果当中,只有三分之一多一 点的检测者的确感染了新冠病毒(这就是后验概率)。 英国人口一 共有 6500 万, 假如政府真的让有人都参加了这项检测, 并向那 些结果呈阳性的人发放免疫证明,就会导致有 300 多万根本没有感 染过新冠病毒的人可以自由地走街串巷,甚至去拥抱免疫力低下的 爷爷奶奶, 而事实上这些人根本不安全。 不弄懂贝叶斯定理的话, 你就没法搞清楚这件事。

当时英国有一群所谓的“威人士”对居家隔离政策持怀疑态 度,其中有一部人已经察觉到检测数据有些不对劲,从而引发了一 场和贝叶斯定理相关的巨大争议。这些人当中著名的应该就是前 威尔士国务大臣约翰·雷德伍德,他认为那些错误的检测结果会歪 曲新冠疫情的真相,并强烈要求政府顾问尽快给出一个制止这种现 象的方案。6

这些怀疑论者之所以会觉得检测数据不对劲,是因为他们误解 了统计学教授戴维·斯皮格霍尔特爵士在一个访谈节目中的言论。 戴维·斯皮格霍尔特经常积极地在各种电视节目和广播频道中向公 众耐心解释什么是检测的准确度,什么是疫苗的有效性。大家已经 明白, 检测的假阳性率为 1%, 并不意味着只有 1% 的阳性结果是 误诊。当时社会正处于一波疫情和第二波疫情之间的缓冲期,此 时人们只要一打喷嚏就得做 PCR(聚合酶链式反应)检测。从数据上来看,当时英国的新冠肺炎患者非常少,隔离政策似乎的确降低 了感染率,可整体上来看,感染率似乎又有一种上升趋势。

那些持怀疑论的“威人士”认为,感染率上升只是一种假象, 贝叶斯定理可以解释个中玄机。 具体来说, 当时有 0.1% 的人感染 了新冠病毒。如果我们随机对人群进行检测,且该检测方式可以在 99% 的情况下正确识别出那些没有感染新冠病毒的健康人,在 90% 的情况下正确识别出那些的确感染了新冠病毒的患者,那么终将 有超过 90% 的人得到假阳性结果。1

这个结论的确没错,问题在于他们对贝叶斯定理的理解不够深 刻。 首先, 先验概率真的是 0.1% 吗?这一概率成立的前提是, 参 与检测的人员都是从整个人口当中随机挑选出来的,但事实并非如 此:参与检测的要么是已经表现出一定症状的人,要么是接触过确 诊病例的人,这些人感染新冠病毒的概率要比其他人高得多。虽然 我们不知道具体高多少, 但我们知道, 即便先验概率只有 1%, 假 阳性的比例也会大幅下降至 50%;如果先验概率为 10%,那么大约 有 90% 的阳性结果是真阳性。

那么, 我们假定假阳性率为 1%, 会不会有点太夸张了呢?事 实上,2020 年夏天新冠疫情开始减弱的时候,检测结果呈阳性的比 例只有 0.05%, 其中包括了真阳性和假阳性, 所以假阳性率不可能 比这一数值还高。如此一来,在新冠肺炎发病率为 0.1% 的前提下,假定检测人数为 100 万,其中有 1000 人确实感染了新冠病毒,那么该检测只能识 别出其中的 900 名患者。剩下的 999000 人当中,该检测将给出 9990 份假阳性报 告。所以拿到阳性结果的人一共有 900+9990=10890,真阳性的比例只有 900/10890, 还不到 9%。假阳性率将下降至 35%。发病率越高,假阳性率就越低。 其实不仅仅是新冠疫情,几乎任何形式的医学检测都会涉及贝 叶斯定理。

英国的国家医疗服务体系(NHS)提供 3 种常规的癌症筛查, 即乳腺癌、 宫颈癌、 结肠癌。 虽然前列腺检查不在常规检查之内, 但 50 岁以上的男性如果有需求,也可以把这项检查加进去。

为什么前列腺检查没有加进常规的癌症筛查呢?毕竟癌症筛查 听上去就是件有益无害的事,越早发现越容易治疗嘛。难道前列腺 检查有什么坏处吗?

就像本书中的其他有问题一样,贝叶斯定理可以给出答案。

前列腺癌的筛查是通过 PSA(前列腺特异性抗原)检测来进行 的。医护人员会检验测试者的血液,如果血液中的 PSA 指数过高—正常值是 3~4 纳克每毫升——测试者就有要接受进一步的检查, 比如扫描或活检。 需要注意的是,PSA 过高既有可能是前列腺癌的 信号,也有可能是感染、炎症的征兆,还有可能是年迈导致的自然 现象。

PSA 检测没有前面提到的那些检测方法那么精准。 根据英国医 疗咨询机构——国家卫生与临床优化研究所(NICE)提供的数据 7 , 如果以 3 纳克每毫升的标准对患者进行 PSA 检测,那么该检测将成 功识别出 32% 的患者(灵敏度),以及 85% 的健康人(特异度)。

另外我们知道,50 岁以上的男性患者中,大约有 2% 患有前列 腺癌。 8 假如参加 PSA 检测的人数共计为 100 万, 那其中大约会有 2 万人确实患有前列腺癌。可是这项检测只能正确识别其中的 6400 名患者。 剩下的 98 万健康人当中, 将有 147000 人需要进行额外的后续检查。如果一名 50 多岁的男性在该检测中得到了阳性结果, 那他实际上只有 4% 的概率真正患有前列腺癌。

4% 的概率需要我们认真对待吗?或许吧, 但可以肯定的是, 阳性患者需要进行额外检测:有些会造成创伤,有些会令身体不适, 有些甚至还具有一定风险。当然,英国的国家医疗服务体系还要为 这些数以万计的核磁扫描、活体检测支付数百万英镑,而这些钱本 可以用来支付他汀类药物、肾移植费用或是护士的工资。此外,前 列腺癌的检测还有很多问题,比如很多情况下前列腺癌细胞的扩散 极为缓慢,以至于很多患者根本无法意识到自己得了前列腺癌;有 时,直到尸检这一步,人们才发现患者患有前列腺癌,但他们的死 因却和前列腺癌毫不相干。

当然, 这里面还有一个问题, 那就是 32% 的灵敏度、85% 的 特异度这两个数值,其实是 3 纳克每毫升这项检测标准造成的。如 果我们把检测标准提高到 4 纳克每毫升,会发生什么?

答案就是, 特异度会从 85% 升到 91%, 也就是说该检测能够 正确识别出更多健康人。 但代价是灵敏度会从 32% 降至 21%, 也 就是说该检测正确识别癌症患者的能力下降了。 假如这次也有 100 万人参加了测试, 那么假阳性人数会下降至 88200, 但与此同时真 阳性人数也变少了——20000 名患者当中只能正确识别出 4200 人。 这种情况下,如果一名 50 多岁的男性在该检测中得到了阳性结果, 那他实际上只有 4.5% 的概率真正患有前列腺癌, 并没有比之前高 多少。

我们无法规避这些数据之前的关联性。我们可以继续提高检测 阈值,比如把标准设定为 5 纳克每毫升,那么假阳性的数量会进一步下降,但代价是假阴性的数量会进一步上升。如果降低检测阈值, 那么假阴性的数量会下降,但代价是假阳性的数量会上升。二者互 相拖后腿的现象是不可避免的。想要真正解决这一矛盾,我们只能 在医学上寻求另一种更优秀的检测方式(这有点像“统计显著性” 问题,在后文中我们还会具体分析)。

虽然乳腺癌和结肠癌的筛查更为精准,但即便是在这两个领域, 其准确性也高度依赖于患者人数在全部人口中的比例。一项大型调 查发现 9 ,在连续 10 年、每年都进行乳房 X 光检查的女性当中,有 60% 的人得到过一次或多次的假阳性结果,继而参加了活检等形式 的额外检查,这些烦琐的检查令她们感到“焦虑、痛苦,总是担心 自己真的得了乳腺癌”。 这一切真的值得吗?答案取决于该疾病在 人群中的发病率,即先验概率。年轻人很少得乳腺癌,如果我们对 40 岁以下的女性进行乳腺癌筛查,那么即便灵敏度和特异度都很高, 也会出现较高的假阳性率,所以对大龄女性进行乳腺癌筛查会更有 价值。 英国国家卫生与临床优化研究所认为, 只有对 50 岁以上的 女性进行乳腺癌筛查, 才具有成本效益。 10 如果不懂贝叶斯定理, 我们就无法得出这一结论。

各位准父母好也了解一下贝叶斯定理。 市面上有一种叫作 “无创产前筛查”(NIPT)的技术, 这种技术会利用孕妇的血液样 本来分析胎儿的染色体状况。在英国,国家医疗服务体系会向高风 险孕妇提供这一服务。当然你也可以去私人诊所,其价格在 500 英 镑左右。

虽然该筛查的准确率高达 99%, 但就像前面的例子一样, 其 准确率无法帮助我们判断手中的检测结果到底在多大程度上是准确的。唐氏综合征、帕托综合征、18 三体综合征都是这项检测的目标 疾病,这些疾病不仅非常罕见,而且相当严重。患有唐氏综合征的 孩子,幸运的话可以活几十年,大多需要终生陪护;而患有帕托综 合征、18 三体综合征的孩子通常会在出生后的数月、 数年之内夭 折。显然,检测结果是否准确对父母来说非常重要。

调查发现 11 , 如果参加无创产前筛查的人不是高危孕妇, 而是 一群普通孕妇, 那么检测结果往往会呈现假阳性。 唐氏综合征的 “阳性预测值”,即阳性检测结果为真阳性的概率为 82%,帕托综合 征的为 49%,18 三体综合征的为 37%。

如果参加无创产前筛查的是一群高危孕妇, 那么这些疾病的 阳性预测值会大幅上升——18 三体综合征的阳性预测值会跃升至 84%。 也就是说, 如果对有孕妇进行无差别检测, 那么每 3 份阳 性结果中就有 2 份是假的;如果只对高危孕妇进行检测,那么得到 假阳性结果的概率还不到六分之一。

这背后仍然是贝叶斯定理。手中刚拿到的检测结果并不能反映 整个事实,我们须想办法得到先验概率,而这既不是什么理论假 说,也不是什么学术难题。如果你已经怀上了宝宝,并参加了这些 测试,且拿到了阳性结果,那贝叶斯定理将会成为你应该采取何种 行动的关键。 而且, 正如后文所说, 你的医生也不一定能帮到你, 因为大部分医生也和普通人一样, 认为 99% 的准确率就等同于检 测结果在 99% 的情况下都是正确的。

和医学界类似,法律界也有一个叫作“检察官谬误”(prosecutor’s fallacy)的案例, 该案例就犯了没有认真考虑贝叶斯定理的错误。 该案例是这样的:假定你正在犯罪现场做犯罪调查,在凶器上采集
到了 DNA 样本, 且该样本与数据库中某人的 DNA 样本匹配。 要 知道,DNA 匹配的精度高——平均每 300 万个样本中才能有 1 个拥有如此高的匹配度。

这是否意味着,嫌疑人只有三百万分之一的概率是无辜的?读 到这里你应该已经有能力意识到,事实并非如此。

你还需要一个信息, 即先验概率。 你是因为掌握了确切证据, 才确定了嫌疑人的吗?还是说你只有 DNA 匹配这一个理由去怀疑 他, 而且该 DNA 数据库是从全国人口中随机挑选出来的?如果是 后者,那么该嫌疑人的确是犯的先验概率只有六千五百万分之一: 因为全国人口为 6500 万, 而此起案件的犯只有一名。 如果你对 全英国人口进行 DNA 检测,你会得到大约 20 份匹配结果,运气好 的话,犯也会在里面。在这种情况下,刚好抓到犯的概率大约 为 5%。

但如果你事先能把嫌疑人的范围缩小至 10 人, 比如你就是神 探赫尔克里·波洛, 犯罪现场只有 10 个疑犯, 他们被暴风雪困在 一幢乡间别墅里, 那情况就完全不同了。 此时的先验概率是 10%, 如果 10 人当中有人和现场遗留的 DNA 匹配上了,那该结果为假阳 性的概率只有大约三十万分之一。1

这不是夸大其词,也不是故弄玄虚,因为法庭上真的有法官曾 以类似的细节为嫌疑人定罪。1990 年,一个名叫安德鲁·迪恩的男 性被法庭判有强奸罪, 证据之一就是 DNA 匹配。 当时有位专家证

1

显然,这未意味着他只有三十万分之一的概率是无辜的——就算不是凶手,他 的 DNA 也有可能以某种方式出现在凶器上。

人跟法官说,DNA 来自其他人的概率只有三百万分之一。 但安德 鲁·迪恩的罪名还是被推翻了(尽管重审之后还是判他有罪), 原 因就像某位统计学家所解释的那样 12 ,“如果某人是无辜的, 他的 DNA 有多大概率和犯罪现场的 DNA 匹配?”和“如果某人的 DNA 和犯罪现场的 DNA 匹配,他有多大概率是无辜的?”是两个不同的 问题,正如“某人是教皇的可能性”和“某教皇是人的可能性”是 不一样的。

有时谬误也会反过来。 奥伦塔尔·詹姆斯·辛普森是美国橄 榄球星,曾被指控谋杀自己的妻子妮科尔·布朗·辛普森。在该 案的审判过程中, 检方指出辛普森曾对自己的妻子施暴, 而辩方 表示:“那些打过妻子耳光或殴打过妻子的男性当中, 只有不到两 千五百分之一的人会在一年之内谋杀妻子,这一概率可以说是微乎 其微。”13

这一谬误与检察官谬误刚好相反。一年之内不仅殴打妻子,还 进一步谋杀妻子的概率,或许真的“只有”两千五百分之一。但这 并不是我们想问的问题。我们想知道的是,如果一个男性殴打妻子, 而妻子又被谋杀了,那凶手是他丈夫的概率是多少?

德国心理学家、 风险理论专家格尔德·吉仁泽表示, 如果两 千五百分之一这个数字是正确的, 那么每 10 万名遭受家暴的女性 中就有 40 人会被谋杀。 14 而在整个美国社会中, 女性被谋杀的比 例为十万分之五。

由此可见,虽然遭受家暴的美国妇女被丈夫杀害的先验概率约 为每年两千五百分之一, 但我们现在可以利用新掌握的信息——已 知该妇女是被谋杀的——来修正这个概率。

现在我们把数据代入贝叶斯公式。 假如某一年有 10 万名妇女 遭受家暴,那么其中大约会有 99955 人没有被谋杀。在被谋杀的 45 名妇女中, 有 40 名是被她们的丈夫谋杀的。 所以我们说, 辩方的 谬误与检察官谬误刚好相反:他们只使用了先验概率,而忽视了新 出现的信息。

贝叶斯定理不仅能够帮助我们分辨推理中的谬误,还能告诉我 们某些更深刻的东西。 借用刚才的一个词,“相反”往往是问题的 关键。通常,统计学与概率学会告诉我们出现某个结果的概率有多 大。如果色子没被动手脚,那“掷 3 个色子全是数字 6 朝上”这件 事,每掷 216 次才会发生 1 次。如果我从未去过犯罪现场,那么我 的 DNA 和现场样本匹配的概率只有三百万分之一。

不过我们想知道的往往并不是这些。如果我们怀疑一起玩色子 的某人是个老千, 那我们可能想知道“如果他掷出了 3 个 6, 那这 些色子没被动手脚的概率有多大”。如果某人的 DNA 和犯罪现场的 样本匹配上了,那我们或许想知道这是一个巧合的概率有多大。这 些问题往往都是一些“相反”的问题。

在相当长的时间里, 概率论所关心的都是前面那一类问题。 但是在托马斯·贝叶斯(后面我们会介绍他的故事)于 18 世纪提 出后面的第二类问题之后, 类似的“反概率”便逐渐引起了世人 的注意。

正如你将在本书中看到的那样,第二类问题总是能够引发大量 争论。贝叶斯定理不仅有大量“信徒”,也有很多“敌人”,从没有 哪个简短的公式能够像它一样引发如此广泛的争议。想想看,你在 网上见过有人因为球面面积公式或欧拉恒等式而吵得不可开交吗?

我认为之所以会出现这种现象, 是因为贝叶斯定理几乎影响 着一切事物。在已经取得某些研究结果的情况下,某科学假说为真 的概率有多大?好吧, 我可以告诉你在该假说为假的情况下, 你 取得这些研究结果的概率有多大, 可二者并不是一回事。 为了研 究前者——已经有越来越多的科学家认为这才是统计学该研究的事 情——我们需要贝叶斯定理,需要先验概率。

不仅如此, 其实有在不确定的情况下做出终决策的行为, 都离不开贝叶斯定理。 更准确地说, 贝叶斯定理代表了理想决策, 决策人在多大程度上遵循贝叶斯定理,决定着该决策在多大程度上 是一个正确决策。 苏格拉底凭借“有人都会死;苏格拉底是人, 所以苏格拉底也会死”建立了完整的形式逻辑,而这其实也只是贝 叶斯定理在“非此即彼”这种端情况下的一个特例而已。

人类似乎就是一台贝叶斯机器,这一结论在相当深的层面上是 正确的:虽然人类在计算贝叶斯定理的时候表现得像个垃圾,但我 们在日常生活中所做出的那些决定,实际上和一个理想的贝叶斯决 策者所做出的决定几乎一致。可惜这并不意味着有人的决定会达 成一致——如果我和你对某件事的先验概率的判断大相径庭, 那么 即便掌握的证据相同,我们也会得出完全不同的结论。这就是我们 在面对气候、疫苗等证据确凿的问题时,仍会发自内心地出现重大 分歧的原因。

在更深的层次上,我们仍然是贝叶斯定理的执行者。我们的大 脑、感知,似乎都是通过“预测世界—先验概率—通过感官获取新 数据—更新自己的预测”这种方式工作的。我们对世界的意识体验 似乎就是佳的先验概率。正所谓,我预测,故我在。
成都布克购书中心店铺主页二维码
成都布克购书中心 微信公众号认证
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

中信出版 | 贝叶斯定理:清晰思考与决策的科学工具

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:CD68689898
成都布克购书中心官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏