人生中最重要的問題,在絕大多數(shù)情況下,真的就只是概率問題。--- 皮埃爾-西蒙·拉普拉斯(1749-1827)高手只所謂稱為高手是因為他們總有一些跟常人不一樣的地方或許就是走路的姿勢更利于健身之類的,其實都是細節(jié)處成就的。
先講一個真實的故事。
我的一個夫妻朋友有了二胎,由于太太年齡較大,所以醫(yī)生警告說,你們的孩子有可能會得唐氏綜合癥。朋友很緊張,那怎么辦?醫(yī)生說,可以做羊水穿刺,以確診是不是真的得了。朋友很開心。不過呢,醫(yī)生又說,羊水穿刺也有可能會失敗,那樣你們的孩子就沒了。這下朋友糾結了,一邊是唐氏綜合癥,一邊是孩子沒了,這可怎么做決定?
醫(yī)生后來又說,高齡產(chǎn)婦得唐氏綜合癥的概率大約是2%,羊水穿刺檢測失敗的概率大約是1%。這下簡單了,堅決不做啊。
所以,我們發(fā)現(xiàn),一旦知道了某件事情發(fā)生的準確概率,我們的決定就瞬間簡單了起來。但問題是,我們怎么能知道這些概率呢?
很多人覺得所謂的概率,都是計算出來的。一枚硬幣,正反面各50%,一個袋子里100個球,30個黑球,70個紅球 ,摸出一個紅球的概率是70%。
那假設一個黑盒子,你事先不知道里面多少黑球,多少紅球,怎么辦呢?其實,現(xiàn)實世界里,我們面臨的絕大多數(shù)情況都沒法計算,都是黑盒子卻需要去判斷概率的問題。
頻率派和貝葉斯派
傳統(tǒng)的方法叫頻率派。關于頻率和概率的區(qū)別,很多人不熟悉。簡單的說,概率說的是事情未來發(fā)生的可能性,而頻率說的是對某事情進行觀察或者實驗,發(fā)生的次數(shù)和總次數(shù)的比值。概率是事情本身的一個固有屬性,是一個固定值,而頻率是變化的,樣本越大,頻率越接近概率。根據(jù)大數(shù)定理,當樣本無窮大時,頻率等于概率。
你拋硬幣10次,不見得會正面反面各5次,但是你拋1萬次,那基本是正反各50%。比如那個黑盒子,你不斷的從里面隨機的拿球出來,統(tǒng)計黑球和紅球的比例,次數(shù)“足夠多”時,你得到的那個頻率,就接近真實的概率。
這個方法用了上百年,現(xiàn)在仍然被廣泛使用,比如某某疾病的發(fā)病率,飛機和火車的出事概率等等 ,都是利用大樣本的統(tǒng)計,逼近真實概率。
但是,我們稍微深入的思考一下,就會發(fā)現(xiàn)這個方法的兩個局限:第一,你只有積累了一定數(shù)量的樣本,才能有一個對概率的初步判斷,你只扔5次,只取10個球,基于小樣本得出的概率很可能錯的離譜。第二,如果這個黑盒子夠黑,你連里面總共有多少個球都沒概念,甚至里面的球的總數(shù)量都是變化的,這時你就沒法判斷什么叫“足夠多”。
現(xiàn)實世界里,我們碰到的大量問題,根本找不到這么多現(xiàn)成的數(shù)據(jù)。還有很多新興事物,壓根沒有先例,一種新發(fā)現(xiàn)的疾病,一個新的產(chǎn)品,一種新的市場策略,那怎么判斷概率呢?瞎蒙嗎?
也對,也不對。
這就需要貝葉斯學派了。
貝葉斯學派的觀點是,概率是個主觀值,完全就是我們自己的判斷,我可以先估計一個初始概率 ,然后每次根據(jù)出現(xiàn)的新情況,掌握的新信息,對這個初始概率進行修正,隨著信息的增多,我就會慢慢逼近真實的概率。這個方法完美的解決了頻率派的兩個問題,我不用等樣本累積到一定程度,先猜一個就行動起來了,因為我有修正大法,而且我也不關心是不是“足夠多”,反正我一直在路上。
貝葉斯學派誕生兩百多年來,一直倍受爭議,甚至連co-founder拉普拉斯自己都放棄了,因為大家覺得這個摸著石頭過河的方法太扯了,太不科學了。直到最近幾十年,隨著計算機技術的進步才大放異彩,現(xiàn)在的人工智能、圖像識別、機器翻譯等,背后無不采用了貝葉斯方法。
那我們需要看看,貝葉斯方法究竟是怎么摸著石頭過河的。
貝葉斯定理(Bayes' Theorem)
這一部分涉及一些數(shù)學公式和計算,但說實話 ,只需要小學算術水平就可以了。
貝葉斯定理如下:
A是你要考察的目標事件,P(A) 是這個目標事件的先驗概率,又叫初始概率,或者基礎概率。B是新出現(xiàn)的一個新事件。P(A|B) 的意思是當B出現(xiàn)時A的概率,在這里就是我們需要的后驗概率。P(B|A) 是當A出現(xiàn)時B的概率。P(B) 是B出現(xiàn)的概率,在這里具體計算稍微復雜一些,指當A出現(xiàn)時B的概率和當A不出時(用A_來表示)時B的概率的總和,用公式表達就是 P(B) = P(B|A) * P(A) + P(B|A_) * P(A_)。P(B|A) / P(B) 可以看作一個修正因子。
上述解釋你可以忽略,簡化的理解為:
后驗概率 = 先驗概率 x 修正因子
舉個例子。
比如你新進入一家公司,你不確定這里MBA學歷對員工升遷的作用,而這個對你的個人發(fā)展很重要,因為你要決定接下來是不是去讀一個MBA學位。由于新來,壓根沒有樣本,這時候你可以采用貝葉斯定理。
P(A) 是你根據(jù)過往經(jīng)驗事先估計的,MBA對升遷有多大好處?比如你先預估一個30%。這時候,出現(xiàn)了一個新信息B,小王升遷了,而且小王是MBA。那么,P(B|A) 是說當MBA管用時,小王升遷的概率,比如你現(xiàn)在的判斷是80%。小王可能本身就有能力且業(yè)績突出,就算沒有MBA也可能會升遷啊,所以P(B|A_) = 50%(發(fā)現(xiàn)了嗎,這個公式自動的幫助我們避免走極端)。
套入貝葉斯公式,P(A|B) = 30% * 80% / (80% * 30% + 50% * 70%) = 41%。從30%提高到了41%。那么當小王升遷這個新情況出現(xiàn)以后,你對MBA作用的概率判斷從30%提高到了41%。
但是,過了段時間,你發(fā)現(xiàn)同樣是MBA的小李,熬了很多年也沒有升遷,最后辭職了,F(xiàn)在你對小李因為MBA有效而升遷的概率判斷降為20%了。套入公式,新的P(A|B) = 41% * 20% / (20%*41% + 50%*59%) = 22%。從剛才的41%跌了近一半。
這樣幾次下來,你就能對這個這家公司對MBA的看法有個相對靠譜的判斷了。
或許你會說,搞這么復雜干嘛,有了新情況,我原來的看法會改變,新情況和自己的預期一致就強化原來的看法,否則就弱化,這不就是常識嗎,還用得著什么數(shù)學定理嗎?
很好,的確一針見血。拉普拉斯說過,所謂的概率就是把人們的常識用數(shù)學表達出來。也有人說,人腦就是采用貝葉斯方法來工作的。
但是我們?nèi)四X有偏差啊,有誤區(qū)啊,會犯渾啊,這個公式讓我們忽然獲得了一個上帝視角,來審視一下,我們自己究竟是怎么做判斷,做決定的,計算機又是怎么模仿并超越我們的,這豈不是很美妙的一件事情 。
讓我們再來看一個復雜一點的例子,這是一個經(jīng)典的案例 ,網(wǎng)上隨處都可以找到。
艾滋病毒(HIV)檢測技術的準確度相當驚人。如果一個人真是HIV陽性,血液檢測的手段有99.9%的把握把他這個陽性給檢查出來而不漏網(wǎng)。如果一個人不攜帶HIV,那么檢測手段的精度更高,達到99.99%——也就是說只有0.01%的可能性會冤枉他。已知一般人群中HIV攜帶者的比例是0.01%。現(xiàn)在假設我們隨便在街頭找一個人給他做檢查,發(fā)現(xiàn)檢測結果是HIV陽性,那么請問,這個人真的攜帶HIV的可能性是多大呢?
我們使用貝葉斯定理。A表示“這個人真的攜帶HIV”,B表示“檢測出HIV”,那么根據(jù)現(xiàn)有條件,P(A) = 0.01%,P(B|A) = 99.9%,P(B|A-) = 0.01%,帶入公式,計算得到P(A|B) = 0.01% * 99.9% * (99.9%*0.01% + 0.01%*99.99%) = 50%!
答案或許和你的直覺不一致,即使在這么驚人的檢測準確度之下,哪怕這個人真的被檢測到HIV陽性,他真有HIV的可能性也只有50%。
我們看到,如果是一種非常罕見的病毒,人群中只有萬分之一的人感染,在這種情況下即使你的檢測手段再高,也很有可能會冤枉人。甚至,如誤診率不是0.01%,而是0.1%的話,也就是檢測手段再差一檔,這個結果就會瞬間從50%降到9%。但是,我們也可以反過來想 ,這么罕見的疾病,一旦被檢測出來了,也有50%的概率真的會得,這個躍遷是從萬分之一,一下子到了50%。而如果我們假設這個病毒的感染率不是萬分之一,而是千分之一,那么在原來的檢測精度下,可能性就從50%升到了90%。
這其實可以解釋為什么我們說一葉知秋,為什么說當你家發(fā)現(xiàn)了一只蟑螂,那么你家里一定已經(jīng)有很多蟑螂了。罕見事件,可以對初始概率做出數(shù)量級的改變。同時,這也解釋了我們有時也不能反應過度,有人叛逃到國外了,我們難道需要徹底關閉海關嗎?真的需要在墨西哥修建長城嗎?
貝葉斯定理,把我們的思考的方式給撕開了,揉碎了。
貝葉斯定理給我們的啟示
塔勒布說過,數(shù)學不僅僅是計算,而是一種思考方式。
現(xiàn)實世界中,我們沒法時時刻刻拿出電腦來演算一下公式,但是我們?nèi)匀豢梢酝ㄟ^這個定理得到一些寶貴的啟示:
1、先行動起來。
大膽假設,小心求證。不斷調(diào)整,快速迭代。這就是貝葉斯方法。
當信息不完備時,對概率的判斷沒有把握時,當然可以選擇以靜制動,但是不行動也是有代價的,你可能會錯過時機,你也沒有機會進步。這個時候,貝葉斯方法給我們提供了一個很好的思路,先做一個預判,動起來,利用新的信息不斷修正原來的預判。
2、聽人勸、吃飽飯,但又不能聽風就是雨。
當我們沒有把握時,我們很容易根據(jù)新信息調(diào)整看法。更大的挑戰(zhàn)是,我們已經(jīng)形成了一個看法,甚至有了成功經(jīng)驗時,當新情況出現(xiàn)后,我們能不能也去調(diào)整自己看法。那個黑盒子,我們摸索了一段時間,估計出了里面紅球、黑球的概率,但是我們有沒有想過,這個黑盒子里的球的比例會變化呢?
有了新信息,我們要對原來的看法做多大程度的修正呢?
這些,不可能有標準答案,但是明白了這個道理,有助于我們及時又謹慎的做出調(diào)整。
3、初始概率很重要。
初始概率越準確,我們就能越容易、越快速的得到真實的概率。疑鄰盜斧,以貌取人,會讓我們離真相越來越遠。而如何獲得相對靠譜的初始概率,是個硬功夫,它需要你的經(jīng)驗、人脈、平時的深度思考,有時甚至和底層的價值觀、思維方式都有關。
丹尼爾.卡尼曼在他的《思考,快與慢》里,就特地強調(diào)了初始概率對貝葉斯方法的重要性。
4、對出現(xiàn)的特殊情況要引起足夠的重視。
前面我們已經(jīng)看到了,萬分之一概率的事情,也有可能因為特殊事件,一下子變成了50%。所以,每當出現(xiàn)特殊的、罕見的情況時,我們要保持高度警惕,黑盒子里的球的比例是不是變化了?但同時我們也看到,如果檢測精度不夠高,即便出現(xiàn)了罕見事件,真實概率也可能不到10%。所以,具體要怎么采取行動,還需要進一步觀察。
5、信息的收集,信息的質(zhì)量,以及對信息的判斷,是提高決策水平的最重要環(huán)節(jié)。
只要有新信息,就可以修正,哪怕初始判斷錯了,新信息足夠多,也能修正過來。但是沒有信息,就沒有修正。所以,在做決定之前,盡可能多的收集信息是必須的。但是錯誤的信息、低質(zhì)量的信息,會讓你的修正偏離真相越來越遠,你能不能區(qū)分信息來源的可靠性、能不能進行交叉驗證、邏輯推理,就顯得至關重要。
要做到這些,甚至某一些,都并不容易,掌握里面的平衡,就更加困難。
所謂高手,就是把自己活成了貝葉斯定理。
來源:網(wǎng)絡整理 免責聲明:本文僅限學習分享,如產(chǎn)生版權問題,請聯(lián)系我們及時刪除。