長文慎入:機會率
利申:我唔識統計學[1]
記得中學年代,有朋友鍾意開玩笑,問親佢嘢,都話「一係發生,一係唔會發生,所以係 50%」。我當時心諗:錯得咁明顯嘅嘢,要 disprove 佢有幾難吖!但係返到屋企諗嚟諗去,都諗唔到點樣證明佢係錯。
又話說,原本呢個「50%論」明顯係笑話,但原來係有人相信嘅。兩年前有位熱血師奶喺網上爭論嘅時候,為咗聲援朋友,竟然引用呢個「50%論」,嘗試論證某女KOL有50%機會因為網上言論而被跟蹤。最後當然俾人笑到臉黃啦。
不過究竟點解「50% 論」係錯呢?咁就唔容易解釋。甚至,可能錯唔晒𠻹。
【機會率係咩嚟?】
機會率係咩嚟? 呢個問題都唔容易答。我哋知道,擲「公、字」嘅機會率分別都係 50%,六面骰擲中某一個數字嘅機會率係 1/6。呢啲機率係點樣嚟呢?如果講理論,唔好意思,個答案好摟打,其實係 假設 嚟嘅。嚴格嚟講,唔係任何一隻銀仔擲公字都 50%,只有 “fair coin” 先至係 50%;亦都唔係每一粒骰都係平均 1/6 機會擲出一至六,只有 “fair dice” 先至係。至於現實生活嘅銀仔骰仔係咪 “fair” 嘅,就好睇佢製作得好唔好,有冇人出老千,等等。
點樣驗證銀仔同骰仔係咪 “fair”?理論上可以靠檢視佢物理上係咪均稱,不過實際上都係用 law of large numbers 比較有效率。我哋知道如果一粒骰仔真係 “fair” 嘅話,擲一萬次就大約有五千次係公、五千次係字。擲完一萬次,如果啲數字差唔多,咁我哋就會相信個銀仔應該係 “fair coin” 嚟嘅。
但其實呢個問題仲未完嘅。就算銀仔骰仔冇出術,都唔排除會有人用只喺小說出現嘅高超手法,控制擲出嚟嘅結果。雖則話 butterfly effect 加上 quantum mechanics 會令呢件事難度飆升,但我唔識排除呢個可能性[2],唯有講埋。咁究竟世界上有冇「真正」嘅「隨機」擲銀仔呢? [唔知呀,咁深嘅哲學問題…]
【我升大學嘅機會率係幾多?】
香港嘅大學學位唔算多。實際數字喺度唔重要,舉例啫。就當每年有2萬學位,有5萬學生報考。咁一個學生成功考到大學嘅機會率係幾多?40%? 其實好睇一個「學生」係咩嚟。如果佢係 Band 1 學校年年考第一,咁佢考到大學嘅機會率可能係 99+%。相反,如果佢從來唔讀書年年考包尾,咁佢考到大學嘅機會率可能接近零。將所有情況用某啲方法拉均(average)嘅話,最後計出嚟應該係 40% 嘅。你亦都可以話,「隨機」抽出一個學生,佢入大學嘅機會係 40%。
不過呢 40% 究竟有冇「用」就見仁見智喇。雖然我唔敢話「隨機」係「資訊不足」嘅代名詞,但好多時,你掌握嘅資訊越多,機率嘅估算就會越「準確」。正如上面兩個學生嘅例子咁,你知佢哋平日讀書成績,自然可以更加「準確」預計佢哋入到大學嘅機會。所以你攞住 40% 呢個數有冇「用」呢?如果你隨便搵個學生出嚟,我唔識佢,咁我根據手頭上資訊只可以話佢有 40% 機會入大學[3]。但由於學生嘅考試能力係相對容易查出,所以講 40% 好無謂。
呢一點,亦都係點解「50% 論」係「錯」。因為只要我哋對一件事有多少少認知,就可以更「準確」判斷佢會唔會發生。例如話,某人升唔升到大學,當然唔可以話「一係得,一係唔得,所以 50%」。攞住政府公布嘅學額同學生數目去計算出 40% 都「好啲」吖。(雖然都唔好得去邊⋯)
點解我特登攞「升大學」做例子,係因為我人生第一次重大考驗嘅時候,望住考評局數據,見到數據顯示某一科會考攞 A 嘅人,高考唔合格嘅機會極低。我諗咗好耐:我嗰科溫咗個 syllabus 嘅 1/3 都冇,走去考天才,究竟有幾大風險呢?⋯⋯ 最後冇肥到,但想告誡下大家,唔好以為「100個人只有1個fail」就代表你有 99% 機會 pass。其實如果你平時穩定地包尾嘅話,咁你 fail 嘅機會率接近 100%。
【機率嘅正確用法】
理論嘅嘢,啱晒都冇用。最緊要係現實生活中,用咗之後改善自己嘅生活。而據我所知,機率有兩個正確用法。
第一,用嚟計數。即係如果你上數學堂或者考統計學,啲機率係用嚟俾你做數,用嚟攞沙紙嘅。非常有用,而只要你有分,咁亦都 by definition 代表你係用得非常正確。
第二,用嚟估計好多樣「同類」事件發生之後,唔同結果嘅分佈。換句話即係要應用 law of large numbers。講單次擲骰嘅結果冇咩意義,所謂「擲骰出 4 字嘅機率係 1/6」某程度上只係講緊擲好多次骰嘅話,有大約 1/6 係出 4 字。
重點係,要有好多「同類」事件發生,先至可以 invoke law of large numbers,將啲虛幻嘅機率,變成對實實在在嘅結果嘅預算。例如賭場咁,佢唔需要每一鋪都贏,佢只需要知道,只要冇人出千,越多人玩,靠 law of large numbers,佢賺錢嘅機會就越接近 100%,而且會越賺越多。又例如保險公司,只要有足夠多嘅人買保險,咁佢哋就可以靠 law of large numbers 同埋死亡率,去計返人壽嘅保金同保額[4]。
【人生如賭博,贏輸都無時定】
喂,我升大學嘅機會率係幾多?原來我未答呢個問題。如果我平日考試好叻,咁機率可能高達 99+%。如果我平日成績好差,咁可能係接近零。但係,99%機會嘅嘢都唔一定發生,而接近冇可能發生嘅嘢,都唔排除有奇跡。呢個世界上又冇 10000 個「我」,最後一係得,一係唔得,點樣運用 law of large numbers 去體現自己升大學嘅機率呢[5]?如果一件事成世只發生一次,一係得一係唔得,咁我話佢係 50/50 又有咩問題?
我覺得我今日問嘅問題真係越嚟越難答。
最吊詭嘅係,其實呢啲「一次性」嘅機率,通常都牽涉所謂 subjective probability,口同鼻拗。Subjective 嘅原因唔(只)係因為升學嗰個係「我」,而係我成世人唔會以同一個狀態考 N 次大學[6]。相反,如果我係賭徒,我去賭場玩返一頭半個月,輸身家就係必然嘅,因為同一類型嘅賭局可以發生 N 次,N 越大,我輸嘅機會越大,最後係無限接近 100%。呢個 probability 係 objective 嘅。不過賭徒總係覺得自己會贏,佢有自己嘅 subjective probability,輸到甩褲都覺得有翻身機會。佢係咪「錯」呢?理論上佢只要堅信自己有贏嘅機會,同埋堅信自己輸咁多純粹係因為「唔好彩」,其實你係冇 rational 嘅理由去證明佢錯。不過現實世界冇咁多「無限接近100%」而唔係100%嘅嘢,所以實際上佢都係錯嘅。
不過,喺賭場賭錢就話明知贏唔到莊家啫。投資又點呢?如果我覺得股市有七成機會升,買咗好多,最後佢跌 — — 咁係我估錯咗,定係唔好彩? [唔識答,不要再說了.jpg]
由於大家都唔知答案,所以「9upper」嘅行業就應運而生。搵條友出嚟講句「今年樓市好大機會跌」有幾難?又唔係 100%,佢老點咗你都吹佢唔漲。一般嚟講,任何人用「機會率」去描述一啲「一次性」事件,佢唔係統計學專家,只不過係一個 9upper[7]。
咁當然啦,啲「一次性」事件嘅機率又未必係老作出嚟嘅。如果你係用一個 statistical model 去計啲機率,咁就可以用同一個 model 去計唔同事件嘅機率。做咗 N 次之後,又係用 law of large numbers,可以估計返你嘅 model 準唔準確。有咩用呢?第一,呢種 model 用嚟賭波、賭馬,計賠率非常有用。(當然仲有好多其他應用啦,不過講賭機易啲解釋)
第二,其實你平時腦入面彈出嚟嘅「機會率」,就係你腦入面對現實世界砌咗個 model 再計出嚟嘅數字。如果你估你有 90% 機會升大學,你就唔會喺暑假開始搵長工,反而可能會睇下心儀大學嘅資訊,甚至睇下關於有興趣學系嘅資訊;相反,如果你覺得入大學嘅機會微乎其微,咁你可能真係去咗地盤學扎鐵[8]。
就算唔知聽日發生咩事,都要都要為比較可能發生嘅嘢做準備。如果我哋因為未來發生嘅事無法 100% 準確預算,就唔做準備,或者唔跟返 “subjective” 嘅機率去做準備,咁人類好快就會絕種。
我哋從來都唔會知道自己估算嘅機率準唔準確,不過無論如何,都唯有相信自己所相信嘅嘢,然後去做。或者聽日有個隕石炸爛地球,或者外星人來襲,或者金仔同侵侵打核戰。我哋覺得呢啲嘢都有 0.00…X% 可能性,但又有咩計?最後人生都係賭博,歌仔都有得唱[9]。
— — — — — — —
- [1] 真係唔識。我連 standard deviation 都唔知係咩嚟,多多指教。
- [2] 都話我唔識,請多多指教
- [3] 其實我唔會咁講,不過如果有人搵支槍指住我個頭叫我噏個數出嚟,咁咪 40% 囉。
- [4] 大概係咁啦,我唔識統計學,唔通有精算師牌咩
- [5] 所以有啲天才發明 many worlds interpretation 打飛機。不過今日我唔會講 quantum randomness。呢啲嘢講咗仲得了。我無牌講 probability 已經得罪晒班 stats 友,如果冇 PhD 仲講埋 quantum randomness,連物理學家都唔放過我,應該好快會有江湖追殺令⋯
- [6] 我意思係,重考,自己準備程度唔同,對手唔同,所有 variables 都唔同,冇得同之前類比
- [7] 唔好意思鬧埋 Nate Silver,不過佢喺我眼中都只係一個好高級同比較準確嘅 9upper
- [8] 按:大學生畢業扎鐵完全冇問題,但應該仲未有人讀緊書都要full time做啩⋯
- [9] 呢篇文有幾多暴露年齡嘅描述?