在法國高中課程里,貝葉斯公式是一個簡明扼要的數學定理,是一個緊湊的等式。其證明只需要一行,而且只需要用到乘除法和有關概率的概念。比起要求高中生和大學生掌握的許多其他數學概念來說,這個公式似乎遠遠更容易學會。但是,即便是最好的數學家也未必理解這個公式。貝葉斯公式的深邃,遠遠超乎了我們的想象。
本文經授權轉載自《貝葉斯的博弈》(人民郵電出版社2021年2月第一版),標題為編輯所加,有刪節(jié)。前往“返樸”,點擊“在看”并發(fā)表您的感想至留言區(qū),截至3月18日24點我們會選出2條留言,每人贈書一本。
撰文 | [法]黃黎原(Lê Nguyên Hoang)
翻譯 | 方弦
初始的力量被注入數種甚至一種生命形態(tài)之中,即使這個星球一直按照引力決定的法則周而復始地運動,但從如此簡單的起點出發(fā),卻演化出了眾多無限美好而神奇的生命形式,并將繼續(xù)演化下去。這種對生命的視點無比壯麗。
——查爾斯·達爾文(1809—1882)
幸存者偏差
在第二次世界大戰(zhàn)中,英國空軍雇用了統計學家亞伯拉罕·瓦爾德研究戰(zhàn)機裝甲的最優(yōu)化。英國空軍注意到,除了前部發(fā)動機所在之處以外,從戰(zhàn)斗中返回的戰(zhàn)機被打得遍體鱗傷。于是空軍得出結論,應該減輕前部裝甲來強化后部裝甲。瓦爾德驚呼:這不對!他的看法是,事情正好相反,飛機只有后部中彈證明了應該加強飛機的前部裝甲。
瓦爾德的這個說法相當驚人。但這其實本質上類似于查爾斯·達爾文對生物中復雜結構的出現做出的解釋。在這兩種情況下,我們當中大部分人所忽略的微妙之處正是淘汰的過程,或者說,我們注意的只是選擇中的幸存者。在瓦爾德的情況中,被淘汰的就是那些前部中彈的飛機,這些飛機的發(fā)動機被摧毀甚至爆炸,因此無法返航。與之相似的是,達爾文斷言那些因缺陷而無法繁衍的動物物種不可避免走向滅亡,因此,在至今仍然存活的物種中,重大缺陷極少。
達爾文的演化理論受到了科學界的一致贊賞,但時至今日,它仍有許多偽科學的批評者。智能設計論證正是這些人用以反駁的工具,這項論證如下。想象一下你在沙漠的正中,如果你偶然發(fā)現一塊奇形怪狀的石頭,那么你不會驚奇于它是自然過程的產物。然而,如果你發(fā)現了一塊結構精巧的鐘表,那么認為它可以通過完全自然的過程產生,似乎太愚蠢了。鐘表的精巧結構似乎只能用有一位擁有智慧的設計師精心制作來解釋。同樣,人體那令人驚嘆的精巧結構,從骨骼與肌肉的生物力學,到免疫系統的組織,再到靈巧的眼睛以及復雜得難以理解的大腦,都只能是智能設計的結果,而這位擁有智慧的設計者只能是上帝。
這個論證可能看上去很有說服力。然而,除了其中將“擁有智慧的設計者”與上帝混為一談這一點值得商榷以外,它也低估了我們上文所說的淘汰過程——達爾文將其稱為自然選擇。
加利福尼亞的五彩蜥蜴
我們現在來到美國加利福尼亞州的中央谷地,那里生活著三種不同的雄性蜥蜴,粗略來說,它們是橙色蜥蜴、藍色蜥蜴和黃色蜥蜴。這些雄性蜥蜴屬于同一物種,所以它們會尋求與同一種雌性蜥蜴進行繁殖。但它們在繁殖上擁有截然不同的特性和策略:橙色蜥蜴非常粗暴,它們控制著特定的領地,并且與自己領地中的所有雌性交配;藍色蜥蜴是忌妒心很重的“一夫一妻制”實行者,它們會控制伴侶的一舉一動;最后,黃色蜥蜴是那種偷偷摸摸的花花公子,只要碰到雌性就飛撲上去。
達爾文的演化理論指出,最有能力繁衍的蜥蜴就是能夠存續(xù)的那些蜥蜴。然而有趣的是,不同雄性蜥蜴的繁殖能力取決于當前其他的雄性蜥蜴種群。
舉個例子,假設大部分雄性蜥蜴是粗暴的橙色蜥蜴。這樣的話,每只橙色蜥蜴都會占據一個龐大的“后宮”,從而無法很好地監(jiān)視雌性蜥蜴。這時,偷偷摸摸的黃色蜥蜴很容易就能與那些未被監(jiān)視的雌性蜥蜴“幽會”,這樣的話,雌性蜥蜴因偷偷摸摸的黃色蜥蜴受精的可能性比因粗暴的橙色蜥蜴受精的可能性高。我們預期偷偷摸摸的黃色蜥蜴的數量會逐漸超過粗暴的橙色蜥蜴。
現在想象一下,占主流的是偷偷摸摸的黃色蜥蜴。那么嫉妒的藍色蜥蜴就可以誘惑雌性并據為己有,這樣的話,所有雌性蜥蜴就會逐步與藍色蜥蜴結合。因此,偷偷摸摸的黃色蜥蜴就無法找到名花無主的雌性蜥蜴,從而無法繁衍。于是嫉妒的藍色蜥蜴就會導致偷偷摸摸的黃色蜥蜴滅絕。
最后,我們假設絕大部分雄性蜥蜴是嫉妒的藍色蜥蜴。這樣的話,粗暴的橙色蜥蜴就會與這些嫉妒的藍色蜥蜴爭斗,將雌性蜥蜴一個一個地擴充進自己的“后宮”。這些嫉妒的藍色蜥蜴就都會變成單身,也無法繁衍。它們最后就會消失,而獲益的是那些粗暴的橙色蜥蜴。
總結一下,大體來說,橙色會輸給黃色,黃色會輸給藍色,而藍色會輸給橙色。這跟“石頭、剪刀、布”很相似,石頭能打敗剪刀,剪刀能打敗布,而布能打敗石頭。這個博弈擁有唯一的納什均衡,就是隨機選擇這三個選項。這也在意料之中。人們在現實中觀察到這三種雄性蜥蜴在自然環(huán)境下共同存在,就像是它們根據“石頭、剪刀、布”的納什均衡進行了選擇一樣!也就是說,雖然納什均衡這個概念本來只能由擁有智慧的參與者實施,但它似乎也完全可以應用到達爾文式演化的結果上。我們會看到這并非偶然。
洛特卡 - 沃爾泰拉動力學
生物學家約翰·梅納德·史密斯在 1972 年提出了演化穩(wěn)定策略這一概念。史密斯將這種策略定義為種群的特定構成,在遭受構成不同的(相對較小的)外來種群入侵時(比如投放 100 只黃色雄性蜥蜴)也能維持穩(wěn)定。在現實中,這一般對應著種群由于統計漲落產生的隨機變化。這種統計漲落是否會對種群產生深遠影響?或者說,達爾文式演化是否會將種群的構成重新引向統計漲落出現之前的狀態(tài)?
為了回答這些問題,我們將會深入、細致地探索達爾文式演化的一個簡化模型?!八心P投际清e的”,但我們將要談到的模型對于眾多生物學家來說相當有用。
你猜到了嗎?支配演化的方程不過是偽裝之后的貝葉斯公式!實在難以置信!與主觀概率對應的是比例zi。從t變?yōu)閠+1時,這些概率會依據某種貝葉斯推斷過程產生變化,其中的思想實驗項由1+fitnessi代替。最后,分母是配分函數,可以保證zi的和在t+1時仍然為 1。
這就是經過分析后令人目瞪口呆的結果。如果將時刻t的適應度看作理論i解釋直到時刻t所得到數據的能力,那么達爾文式演化與理性客體毫無二致!
這種比較也許看似荒謬,卻有另一引人注目的定理作為佐證(即使它在數學上是顯然的)。這個定理由生物學家約翰·梅納德·史密斯在 1973 年證明,它斷言達爾文式演化產生的種群變種比例必然屬于納什均衡。驚人的是,這些納什均衡對應著擁有智慧的理性客體在博弈中采取的策略。換句話說,正如沙漠中的鐘表一樣,納什均衡所刻畫的比例分配似乎只能是出于智慧客體的某種意圖的結果,至少人們會有這種樸素的信念。但事實并非如此。
看似是智慧的果實,卻只是達爾文式演化不可避免的結果。這就是梅納德·史密斯的這一定理令人瞠目結舌的結論。
遺傳算法
達爾文式演化遠遠不止是人類智慧蒼白的復制品,實際上它能輕易創(chuàng)造出人類智慧也難以想象的結構——常被引用的經典例子就是人類大腦。雖然演化知道怎么將它設計出來,但即使有了超級計算機,神經科學到現在還無法完全理解人類大腦。
來自達爾文式演化的這種精巧復雜如此攝人心魄,令計算機科學家與應用數學家轉向了所謂的遺傳算法,用以找出某些問題的答案,而除此以外的解法無人知曉。這些遺傳算法除了模仿自然選擇,還模仿了雜交與變異。
比如說,假設我們希望確定一個訪問法國最大的 100 個城市的方法,使得路程費時最少。這個問題又叫作旅行推銷員問題。每個訪問城市的順序都是問題的可能解答,而我們的目標是找出最優(yōu)的解答。這個問題的難點在于可能的解答有如恒河沙數,一共有100!≈10^157個可能的路線。即使我們將地球上所有超級計算機組合起來,列出所有排列,完成這一任務所需的時間也遠遠超過了宇宙的年齡。
遺傳算法對于這類問題的處理無比高效。這種算法的原則就是維持一個多樣化的種群,其中包含有前途但并非最優(yōu)的解答。在每一步迭代時,算法會選擇種群中的兩個解答,對其進行雜交操作,在其中添加(有益的)變異,然后進行選擇,其中最差的解答會被淘汰。奇怪的是,這種達爾文式的優(yōu)化方法好得驚人,甚至是許多情況下最優(yōu)秀的解法!
達爾文式演化在這種情境下比人類的智慧要做得更好。所以,自然的精巧作為反駁演化理論的論點并不令人信服。但我們在第 11 章仍然會談到這個問題。
構筑自己的意見?
科學與偽科學之間的區(qū)別,是被稱為“懷疑主義”“批判性思考”或者“探索派”的思想運動偏好的話題。這一思想運動主要討論偽科學支持者的常見詭辯與認知偏差。這些論證中的錯誤的確相當糟糕,是大量陰謀論、替代醫(yī)學和超?,F象的基礎。
對于某些人來說,對這些問題的正確反應是構筑自己的意見。然而,這種反應的危險在于,有些事情必須具有大量知識或者經驗儲備才能得出足夠切中要害的意見,但這種反應難免導致對這些事情的懷疑,甚至是無法避免的偏見、誤解和錯誤。例如琳達問題、 值爭議或者差分隱私的概念就屬于這一類情況。某些更重要的問題,比如疫苗的有效性、谷歌和 Facebook 的算法,以及氣候變化的人為因素,也都屬于這類情況。除非你花上好幾年細細研究這些問題,否則你自己形成的意見必定缺乏足夠的信息,也因此無足輕重。
我們十分希望即使只花上幾個小時,最終也能在這些問題上得出正確的答案,但事實遠非如此。比如說在琳達問題中,直覺會使我們的錯誤率比一只隨機選擇答案的黑猩猩的錯誤率還要高。統計學家漢斯·羅斯林就證明了這一點。對于許多問題,比如女性平均受教育時間、自然災害造成的死亡人數、世界貧困人口等,我們的表現比無知還要糟糕,我們一貫選擇的都是錯誤答案!
更糟糕的是,要估計應該對自己的直覺有多少信心,對我們來說難上加難。因此,即使花上相當長的時間思考并汲取有關某個問題的信息,我們對于自己理解了多少,以及自己的意見是否考慮了足夠多的信息,了解起來可能還是相當困難的。雪上加霜的是,德里克·穆勒的博士論文證明,哪怕是對物理現象完全正確的視頻解釋,也可能會提高學生對自身直覺的信賴,即使學生剛才觀看的視頻解釋完全否定了這些直覺!
我們每個人都經歷過太多次這種反復出現的自信過度了。你可能也明白,這就是我在本書中嘗試克服的主要認知偏差。這也是貝葉斯公式、埃爾德什在蒙蒂·霍爾問題中遇到的困難,以及所羅門諾夫不完備性迫使我們承認的東西:我們總是過分自信。正如偉大的邏輯學家伯特蘭·羅素所言:“世界上所有問題的根源在于,笨蛋和盲信者總是無比自信,而更有智慧的人卻一直在懷疑?!卑侔病た巳R因 **(注:法國的物理學家及科學哲學家)**補充道:“要盡量避免得出結論?!?/p>
實際上,“只靠自己”去相信任何事物是個難于登天的任務,其中布滿無法逾越的障礙。我很不建議你這樣做。如果構筑正確的意見那么容易的話,那高等研究就不需要花那么長的時間了,而且知識也不會被如此切分為相互隔絕的學科了。如果沒有足夠的財力、時間和認知能力去沉浸在特定問題的詳細研究之中的話,那么我們就難免需要依靠他人的意見。這并不是個壞習慣。實用貝葉斯主義者也更傾向于利用其他人在數十年甚至數百年中做出的工作來細化自身對世界的理解。即使是純粹貝葉斯主義者也知道,其他個體能訪問眾多她無法訪問的數據,所以她有不少東西可以向這些人學習。
單個科學家并不可靠
所以,要理解我們身處的這個世界,訴諸權威是一個強大、有效且實用的工具。然而這也帶來了下面的問題:誰是最可靠的權威?愛因斯坦提出的論證是否比莎士比亞的論證更有價值或者更值得相信?我們可不可以盲目信任科學家?
在面對這些問題時,某些探索派學者(也就是捍衛(wèi)批判性思維的人)和某些科學家會強調科學方法的客觀性。他們認為,科學家得出結論的方法就是完全嚴謹、客觀并且經過同行評議的論證。因此,他們的結論比偽科學家的結論更有價值,因為偽科學家并不遵循這一方法。
然而,優(yōu)秀的探索派學者會提防這種粗糙而刻板的論證。首先,某些偽科學或多或少遵循的是科學方法的路線。此外,貝葉斯主義否定了這種科學方法的客觀性,甚至也否定了它的正確性!但更重要的是,科學工作者幾乎從來不按照科學方法做事。
在科學文獻中任意選取一篇論文,論文的作者很有可能并沒有提出什么假設,也沒有確定某個帶有限制的實驗流程,同樣沒有根據這個流程來進行實驗,最后也沒有用 值得出結論、完成論文。無論是現代還是過去,科學更像是一連串的試錯、建模、模擬、參數調整,以及實驗中的質疑。通常只有在獲得所有結果之后,論文的寫作才開始。寫作時,作者選取的角度通常忽略了實驗室中絕大多數錯誤線索,為的是更好地將新發(fā)現組織起來,并推出一個引人深思的結論——大部分讀者也覺得這相當值得贊賞。
更糟糕的是,科學工作者同樣無法避免那些導致偽科學的認知偏差甚至詭辯的荼毒。這是因為,正如我們在第 1 章和第 2 章中看到的那樣,即使是最優(yōu)秀的科學工作者,面對某些簡單卻令人困惑的問題也無能為力,就像埃爾德什在面對蒙蒂·霍爾問題時那樣。曾經有很長的一段時期,最優(yōu)秀的科學家認為地球是宇宙的中心、幾何必須是歐幾里得幾何,或者人工神經網絡是人工智能研究的死胡同——當我在 2011 年第一次看到人工神經網絡的數學描述時,我的反應就是這樣的!
即使是偉大的愛因斯坦,做出過對于許多物理學家來說如同奇跡的突破,他也曾經反復犯下錯誤,比如在 1913 年為有問題的廣義相對論前身做辯護,還有為了強行加入穩(wěn)態(tài)永恒宇宙的可能性而在廣義相對論方程中引入了一個宇宙學常數——他自己將其稱為“一生中最大的錯誤”。無論是現在還是將來,即使像最優(yōu)秀的科學家那么聰明的人,擁有的認知能力也有極限。
還有更嚴重的問題。學術界體系中的一些激勵措施與對認知偏差的永恒斗爭并不相容。這是因為,某個科學工作者的聲譽,或者僅僅是保留當前職位的能力,依賴于其思想的獨創(chuàng)性和發(fā)表論文的數目。在這種情況下,科學工作者有著充足的動機去瘋狂捍衛(wèi)自己的思想,而且通常超出了貝葉斯公式允許的范圍。科學工作者甚至有動機去杜絕貶損自己過去提出的并曾給自己帶來榮譽的理論,即使這些理論最終被否定了。最后,科學工作者卻沒有動機去花時間驗證與其競爭的理論的正確性,因為科學期刊不會發(fā)表對已有理論的鞏固工作。
最后,在某些極端但確實存在的情況中,某些科學工作者的科研經費來源要求他們得出某些預定的結論,比如說那位向煙草產業(yè)出賣了靈魂的羅納德·費希爾。然而,我們也無法完全排除這些不正常的經費來源。
這幾個論點似乎傷害了科學工作者的可信度。此外,當我看到某些著名科學家在公開演講中使用某些論證捷徑時,我對他們的言論的置信度就遭到了沉重打擊。從我自己的角度來說,在為 Science4All 或 ZettaBytes 制作視頻時,我傾向于極度回避技術難點,從而傳遞出令人信服而且饒有趣味的清晰信息,因為這些視頻的首要目的是推廣數學和計算機科學。正是出于這個原因,我曾多次向受眾說謊——包括在這本書中。我深深仰慕的其他科學家在我之前也說過這種有意的謊言,但這一點都不出人意料。在介紹哥德爾的定理時卻沒有介紹一階邏輯的那些人,必定也要說一點小小的謊言。力圖面向一般大眾推廣科學會迫使我們在措辭中更偏好流暢,而非嚴謹。
訴諸權威
話雖如此,某些專家在某些特定問題上的意見對我來說有著完全不同的價值。我在預科班第一年時的數學老師就是這種情況。跟很多學生一樣,我對他那些意見的重要性心悅誠服。如果我們的想法在某個數學問題上有沖突的話,我不僅會立馬開始強烈懷疑自己,甚至還會完全否定自己的信念。但更重要的是,我很快就會相信他的想法,并嘗試理解這些想法的根源。
同樣,如果某位著名科學家多次令我震驚于其見解中的智慧,那么當他針對其專門領域的特定問題說出驚人的意見時,無論我在聽到這個意見之前相信的是什么,我對這位科學家表達的意見的置信度都會急速上升。
舉一個例子。某位研究邏輯的朋友有一次跟我說,跟粗糙的論證以及維基百科上寫的正好相反,存在這樣的數學模型,其中所有實數都是可定義的。我曾多次見識過他在數理邏輯方面的造詣,即使我對維基百科的數學頁面有著很高的置信度,我還是開始嚴重懷疑我此前的想法,甚至很快就相信了我朋友的說法,即使我并不明白為什么他會相信有這么一回事。
這就解釋了為什么純粹貝葉斯主義者會無視那些權威氣候懷疑論者。石油企業(yè)有著巨大的經濟效益,它們能找到愿意捍衛(wèi)其觀點的人,這一點毫不令人意外。除此之外還有巨大的選擇性偏差。如果某個節(jié)目愿意給氣候懷疑論者提供發(fā)聲的渠道,那么受邀者捍衛(wèi)氣候懷疑論的概率必然等于 1,即使他的論點是錯誤的。
盡管如此,這個論證對于對立陣營同樣有效。即使氣候變暖是錯誤的,某位激進環(huán)保主義者為氣候變暖辯護的概率仍然接近于 1。如果激進環(huán)保主義者可以這樣說的話,那么那些被邀請到媒體上露面的科學工作者也可以這樣說,這出于我們在上面說過的那些認知偏差,而科學工作者也是這些偏差的受害者。一言以蔽之,對于類似氣候變暖這樣牽涉重大經濟或政治利益的富有爭議甚至引起意見兩極分化的問題,訴諸權威的論證幾乎毫無效果。
所以,有時候我相信某些自己沒有理解的事情。甚至可以說,我之所以相信這些事情,都是因為訴諸權威的論證。有些人斷言這不是理性的。然而,即使我當下不知道這些事情是否正確,這事實上也是唯一理性的后驗立場——至少在相信貝葉斯公式的情況下 。
科學共識
我們回到氣候變化的問題。我們已經看到,任何一位科學工作者都不能作為權威。此外,與其挑出某位氣候學的專家,探索派學者通常更重視氣候學界的意見。然而意見只有一個,氣候學界的絕大部分工作者相信氣候在變化,而且這種變化來源于人類——在報道中,這個群體中這樣認為的人數通常超過 98%。但如果每一位科學工作者都不可信的話,為什么整個學界的意見就更為可信呢?
對于這個問題,純粹貝葉斯主義者有一個重要的答案:與每個成員相比,科學共同體對貝葉斯公式的應用更恰當。如果將科學共同體想象成一塊土地,那么不同的理論T則是在這塊土地上生活著的不同物種的動物。在每個時刻t,最令人信服的理論更能繁衍下去。這些理論更容易被科學工作者所接受。我們將在時刻t接受某個理論T的科學工作者的比例記作PT(t),洛特卡–沃爾泰拉方程就能應用到思想的演化上 (為了方便,不失一般性,我將 fitness + 1 換成了 fitness) :
你明白我要說什么了嗎?不同理論在科學共同體中的達爾文式演化,正是偽裝過的貝葉斯推斷!
換句話說,這就像是科學共同體應用了貝葉斯公式來使最可信的理論脫穎而出。正因如此,科學共同體理應擁有的置信度要遠遠超越其中任何個體的意見。只要理論的適應度與思想實驗項相關,那么科學共同體就比其中任何個體都更能貼切地應用貝葉斯公式。
作者/譯者簡介
黃黎原(Lê Nguyên Hoang):瑞士洛桑聯邦理工學院科學信息與通信學院研究員,美國麻省理工學院博士后,加拿大蒙特利爾理工學校應用數學博士。設立多個科普網站、網絡視頻頻道及播客,著有多部數學、計算機理論著作。
方弦:巴黎七大組合數學博士,曾于波爾多、里昂、格拉茨等地大學工作,現為巴黎居斯塔夫·埃菲爾大學計算機系助理教授。