单个随机事件发生的概率,是其在样本空间的比率。那么多个随机事件合并发生的概率又该如何计算呢?
常见的多个随机事件概率计算题都是什么样的呢?稍有了解的人都知道,它们非常折磨人。比如,“从一副扑克牌中有放回地一张张抽取纸牌,求在第6张得到全部4种花色的概率”。再比如“箱子里装有号码1~N的球,有放回或者无放回地摸出n次球,问球号正好是严格上升次序排列的概率是多少”。
看到这种题目,你可能只想立马合上手中的书,找个地方静静。不用担心,我并不打算讲这些。
这一节,我想抛开那些复杂的问题,讲一讲多个随机事件概率计算的本质——无论多么复杂的问题,都是基于两个基本法则来运算的:
第一个是“加法法则”;
第二个是“乘法法则”。
相信我,我要讲的多个随机事件概率计算只涉及加减乘除四则运算,你一定能看得懂、学得会。
加法法则加法法则是指,多个随机事件发生其一的概率,等于每个随机事件各自发生概率之和。
如果是两个随机事件,一个随机事件发生或者另一个随机事件发生的概率,也就是这两个随机事件发生其一的概率,等于两个随机事件各自发生概率的和。三个随机事件发生其一的概率,就是三个事件各自发生的概率之和。以此类推。
比如,澳大利亚网球公开赛开赛前,专业分析师预测,费德勒获得冠军的概率是20%,获得亚军的概率是15%,那费德勒闯入决赛的概率就是他获得冠军的概率与获得亚军的概率之和,也就是20%+15%=35%。
不过,加法法则也有个限定条件,就是这些随机事件不能同时发生,这也被称为“互斥”。拿刚才的例子来说,费德勒获夺冠军和获得亚军不能同时发生,你不能说他既获得了冠军又获得了亚军。只有这样的随机事件,才能直接用加法法则。
举个反例。天气预报说,周六下雨的概率是50%,周日下雨的概率是60%,那周末两天有降雨的概率是多少呢?是周六下雨的概率直接加上周日下雨的概率吗?这样加起来的结果是110%,超过1了。前面讲了,概率一定在0~1之间,不可能大于1,所以用加法法则直接计算肯定不对。那到底哪里出错了呢?
可能你已经发现了,周六下雨和周日下雨这两个事件并不互斥,周六下雨了,周日也可以下雨,它们可以同时发生。也就是说,还存在“周六和周日都下雨”的情况,所以不能直接用加法法则。那应该怎么计算呢?具体来说,有三种计算方法。
第一种计算方法是,将事件拆分为互斥的情况。周末下雨包含三种情况。
情况1:周六下雨,周日不下雨,这种情况的概率为
50%×(1-60%)=20%;
情况2:周六不下雨,周日下雨,这种情况的概率为
(1-50%)×60%=30%;
情况3:周六周日都下雨,这种情况的概率为
50%×60%=30%。
以上三种情况是互斥的,因此可以用加法法则,即周末两天有降雨的概率为:
20%+30%+30%=80%。
第二种计算方法是,用周六下雨的概率加上周日下雨的概率,减去周六和周日都下雨的概率。这是因为周六下雨包含了周六和周日都下雨的情况,周日下雨也包含了周六和周日都下雨的情况,等于多算了一次周六和周日都下雨的情况,所以减去一次周六和周日都下雨的概率即可。也就是说,周末两天有降雨的概率为:
50%+60%-50%×60%=80%。
第三种计算方法是,反过来计算,只要求出周末两天都不下雨的概率,用1减去这个概率就可以了。
两天都不下雨的概率为(1-50%)×(1-60%)=20%,因此周末两天有降雨的概率为:
1-20%=80%。
乘法法则和加法法则一样,乘法法则也是针对多个随机事件的概率计算。乘法法则是指,多个随机事件同时发生的概率,等于各个随机事件各自发生概率之积。
以两个随机事件为例,要计算两个随机事件同时发生的概率,将两个随机事件各自发生的概率相乘就行了。比如,问“木村拓哉和金城武一起向你表白的概率是多少”,就要用乘法法则,也就是等于木村拓哉向你表白的概率乘以金城武向你表白的概率。
不过,和加法法则一样,乘法法则也要求各个事件得是独立事件。如果是独立事件,彼此互不影响,乘法法则可以直接使用;如果是非独立事件,那就不能直接使用该法则了,而是要对乘法法则做个变形。具体怎么变,我们在讲条件概率时会详细解释。
概率计算的真正困难是读懂问题
看到这里你可能会觉得概率计算是不是挺简单的,只需要会加减乘除四则运算就可以了。正因为概率计算简单,所以概率论考试的时候,老师只能把题目描述得非常复杂,经常出现“或”“同时”“有放回”“无放回”等词。题目出现一字之差,结果就会大相径庭。
大部分人不会做概率题,或者做不对概率题,不是因为不会计算,而是因为没看明白题目。也许打败他的不是数学,而是语文。真正读懂题目的意思,才是概率论考试的重点。
概率论老师为什么要把题目弄得这么复杂呢?是为了故意把学生难住吗?当然不是。这其实是一种思维方式的训练:让学生在复杂的题目中,寻找“或”,寻找“同时”,辨析“互斥”,辨析“独立”,计算和分辨各种复杂的排列组合,从而学会把考卷上的题目翻译成一个个的概率问题。
要知道,我们在实际生活中遇到的概率问题,可比加减乘除困难多了,甚至比考卷上设定的题目更难。在现实生活中我们不会计算概率,往往就是因为不会把一个现实问题准确地翻译成对的概率问题。这就好像我们有很多把钥匙,却总是拿它们开错的锁一样,结果当然是打不开。
举个例子。看到飞机失事的新闻后,有些人常常开玩笑说,“从概率的角度来说,下一班飞机更安全。因为如果飞机失事的概率是百万分之一,那么飞机连续两次失事的概率就是百万分之一乘以百万分之一,也就是万亿分之一”。
你可能要笑了,因为这就是典型的赌徒谬误嘛。一般人认为,赌徒谬误产生的原因是人们没弄懂独立事件的含义。但我要告诉你的是,即便弄懂了独立性,知道两个航班互相独立,很多人还是会算错,因为这些人对现实问题翻译得不对。他们混淆了“飞机连续失事两次的概率”和“飞机再次失事的概率”。注意,这两个看似差不多的表述差别是很大的。
一个事件发生两次的概率是什么?简单地说,是你准备抛两次硬币,在还没抛的时候,问两次都是正面的概率是多少呢。这时用乘法法则,就是,结果是 。换到飞机失事的例子中,飞机连续两次失事的概率,就是两个“飞机失事的概率”相乘,确实可能是万亿分之一。但要注意,这是在飞机失事之前计算的。
而“一件事再次发生的概率”是什么?是已经抛了一次硬币,正面朝上,问下一次还是正面的概率是多少。我们知道,抛硬币是独立事件,再次出现某个结果的概率不受前面结果的影响,所以,下次正面朝上的概率自然还是 。换到飞机失事的例子,一架飞机失事后,注意,这架飞机已经失事了,它再次失事的概率,就是普通飞机失事的概率,还是百万分之一。
你看,对现实问题的翻译不同,概率计算的方式也就不一样。我们说的是飞机再一次失事的概率,但你计算的是飞机连续两次失事的概率,计算结果当然不能反映现实问题,必然会出错。
正确翻译现实问题,是概率计算最复杂的地方。概率思维的核心,就是准确地将现实问题转换成对的概率问题。这也是本书想重点带给你的。
本节思考题
你有过因为没有准确地翻译现实问题,而导致失误的经历吗?
扫描二维码查看解析
2.2 法则应用:怎样提高找到真爱的概率
概率加法法则与概率乘法法则在概率计算中的意义非常清晰,但我们通常会忽略,这两个法则在生活和认知方面也有重要的意义。
比如说,大多数人内心都渴望真实、浪漫的爱情。但很多时候,人们总会感到困惑和失望,总是感觉遇不到真爱,甚至连真爱的候选对象都遇不到。如果你也有这种感觉,从数学上看,你的感觉挺有道理的。
潜在交往对象的数量有多少
你可能知道,数学家找对象很难,所以,绝大多数数学系的学生都转行了,包括我。有个长期单身的数学家叫彼得·巴克斯(Peter Backus),他在2010年发表了一篇名为《我为什么没有女朋友》(Why I Don't Have a Girlfriend)的文章。经过严谨的计算,他得出了这样一个结论:银河系中可能与人类接触的、拥有智慧生物的外星文明的数量,比可以与他交往的潜在女友的数量还要多。
在这篇文章中,他对德雷克公式做了一些改动,并最终利用这个公式计算出了符合他择偶要求的女性的数量。德雷克公式是射电天文学家弗兰克·德雷克(Frank Drake)提出的一个公式,用来估算银河系中可能与人类接触的外星文明的数量,公式如下:
N=R*×fp×ne×fl×fi×fc×L,
其中,各参数的意义为
N:银河系内可能与人类通讯的文明数量;
R*:银河系内恒星形成的速率;
fp:恒星有行星的概率;
ne:位于适合生态范围内的行星的平均数;
fl:行星发展出生命的概率;
fi:演化出高智慧生物的概率;
fc:高智慧生命能够进行通讯的概率;
L:高智慧文明的预期寿命。
德雷克公式很好理解,就是把最终要求解的问题逐步分解了:先探索银河系中恒星形成的平均速度、恒星拥有行星环绕的概率,再考虑存在生命的行星的概率,最后再计算智慧生物的技术发展潜力、向太空发送其存在的可探测信号的文明的概率等,就可以得到最终结果。
当然,我们始终无法精准计算外星文明的数量。不过,估算出无法证明的数量是每个人都需要掌握的重要技能,这就是基于概率的费米估算法。
回那个单身的数学家巴克斯。他估算可交往女朋友数量的方法,与德雷克的估算方法是相同的,那就是把问题不断细化、分解,直到可以做出有根据的猜测为止。巴克斯列出的条件如下:1.
住在我所在城市(伦敦)的女性,我不要异地恋;(满足条件的人数:400万)
2. 年龄上匹配,-10岁~+10岁;(满足条件的比例:20%,即80万人)
3. 目前为单身—数学家还是有基本道德的;(满足条件的比例:50%,即40万人)
4. 大学本科学历,否则怎么有共同的数学话题?(满足条件的比例:25%,即10万人)
5. 可能存在吸引我的魅力,也就是我能看得上;(满足条件的比例:5%,即5000人)
6. 可能觉得我有魅力,也就是能看上我;(满足条件的比例:5%,即250人)
7. 相互看得上,同时还能合得来的。(满足条件的比例:10%,即25人)
按照巴克斯的要求一条条筛选下来,到最后,全世界只有25个人可能是他潜在的交往对象。要知道,德雷克算出的银河系中可能与人类接触的外星文明大约有1万个,是孤独数学家潜在交往对象的400倍!
单身的朋友,你可以按照巴克斯的方法算算你潜在的交往对象有多少,再想想城市这么大,你遇见她们/他们的概率有多少。
如何提高潜在交往对象的数量
我觉得,巴克斯这个数学家活该单身,因为他要求太高了。在同城、年龄匹配、单身、本科学历这几个条件之外,他能看得上的居然只有5%,更过分的是,他觉得能看得上他的也只有5%。
他的意思是,每遇到20个同城、适龄、单身且有本科学历的女生,他只能看得上1个;每10个他看得上的女生,只有1个能跟他合得来。也就是说,他需要遇到200个同城、适龄、单身且有本科学历的女生,才能找到1个他既看得上、又合得来的人。是的,这还没考虑对方是否喜欢他。
看到这里,你心里想的大概是,巴克斯,你也不照照镜子,你是学数学的好吗?哪来的自信提这么多条件?
我和你的看法一致。现在的问题是,怎么提高这个数值,让巴克斯潜在的交往对象数量多一些呢?读者们大概会异口同声地回答:降低条件。
我们注意到,巴克斯提的这7个条件都有独立的概率,如果7个条件都需要满足,就要使用概率的乘法法则,将所有概率相乘。而乘法计算的特点是,要想提高最终的乘积,就需要提高某些乘数的值。应用到概率计算中就可以知道,要想提高整体概率,就需要提高某些环节的概率。比如,如果不在意有没有上过大学,潜在交往对象的数量会是现在的4倍;如果不强求在伦敦,而限制在英国,潜在交往对象的数量将再提高10倍。
可以看出,在概率乘法法则的框架下,放弃一些要求,成功率将能大幅度提高,而且经常是成倍地提高。
现实生活中有大量应用概率乘法法则的例子。比如,提高网站流量转化率这件事。用户进入网站首页后就开始有留存率,随着用户不断地深入页面,每个环节都会有各自的留存率,最后才会到转化。产品整体的转化率就是所有阶段留存率的乘积。想提高网站的转化率,最有效的方式就是减少环节,或者集中力量改善某一环节,使其留存率大幅度提升。
如果再考虑成本的计算,这就是几乎所有讲流量、转化、增长黑客、社群营销等一系列的令人兴奋不已的课程的本质:要么减少环节,要么集中提高某一个环节的留存率。
加法法则有什么启示
从概率计算的角度来说,想增加潜在交往对象的数量还有一个方法,那就是把应用概率乘法法则的情况,转变成应用概率加法法则的情况。
我们知道,所有的事情都不可能两全,你想找一个既长得好看、又温柔、还要做饭好吃的女朋友,确实很难。如果我们守住这3个条件,但不要求她满足“又”的条件,而是满足“或”的条件,可能能转变成另一种选择视角。
如果我想找个要么长得好看,要么温柔,要么做饭好吃的女朋友,只要三个条件满足一个就可以了,那潜在交往对象的概率是多少呢?这时候,就不能应用概率乘法法则,而是要应用概率加法法则了。
假设满足每一个条件的概率分别是40%、40%和30%,那总的概率是40%+40%+30%=100%吗?也就是说,我百分之百能遇到三个条件满足其一的潜在交往对象?你想多了。改成或的关系,将乘法变成加法之后,还要减去它们相互重叠的部分,毕竟总有潜在交往对象是长得好看又温柔,或者做饭好吃又长得好看等,要把这些相互重叠的概率减去。
最终概率虽然不是100%,但即使减去重叠的,理论上,潜在交往对象的概率也远大于任意一个条件的概率。使用加法法则还有一个好处,那就是你可以提高条件,你可以把长得好看从40%的标准提高到20%,把性格温柔也提高标准。虽然你对每一项的要求提高了,但只要各项要求之间的关系是“或”,遇到潜在交往对象的概率依旧会高于乘法框架下的概率。
乘法法则构建的是一个串行思考框架,需要依次满足各个条件,才能最终达成目标,而加法法则构建是一个并行思考框架,每一个条件都可以直接达成目标,这样完成目标的概率就会提升。
还是来看提高网站转化率的问题。最常见的处理方式其实是增加品类,客户不买这个,也许会买那个,反正最终的整体收入都会增加。所谓“深挖用户、提高存量用户价值”,“通过增加产品增加服务”,都是将应用概率乘法原则的情况改变成应用概率加法法则的情况。
公司招人同样也是如此。招优点突出、缺点也明显的人,可能比招一个各方面都很均衡的职员还要容易一点。敢于招优点突出的人,说明老板有容人之量、用人之能。而用这种方式组建团队的效率反而可能会更高。不要等那个你心中非常满意的、各方面都很优秀的天选之子出现,不如招一个某项能力突出的员工,这样既能给团队带来多样性,还能享受多样性带来的额外红利。关于多样性红利,很多书籍都有提及,这里就不展开讲了。
概率乘法法则和概率加法法则,不仅仅是做题时可以使用的两种计算工具,更重要的是,它们为我们开辟了另一种分析问题、处理问题的视角。
本节思考题
对于本书作者刘嘉老师,下面3句话哪句为真的概率最大?( )
A. 刘嘉老师是南京大学的老师
B. 刘嘉老师是南京大学的老师,他很爱做饭
C. 刘嘉老师是南京大学的老师,他很爱做饭,且酷爱运动
扫描二维码查看解析