本次將為大家介紹擴(kuò)展式博弈。在分析擴(kuò)展式博弈時(shí),我們通常會(huì)用到“博弈樹”,博弈樹是通過(guò)節(jié)點(diǎn)和分支來(lái)分析博弈的工具
首先我們通過(guò)“阻嚇博弈”的例子介紹如何使用博弈樹進(jìn)行分析。
現(xiàn)在市場(chǎng)上只有一家企業(yè)(incumbent),另一家企業(yè)可以選擇是否入場(chǎng),如果選擇入場(chǎng),對(duì)于舊企業(yè)而言,如果選擇保持價(jià)格,那么新企業(yè)獲得10收益,舊企業(yè)獲得50收益;如果選擇降低價(jià)格打價(jià)格戰(zhàn),那么新企業(yè)獲得10虧損,舊企業(yè)獲得30收益;如果選擇不入場(chǎng),對(duì)于舊企業(yè)而言,如果保持價(jià)格,那么舊企業(yè)獲得100收益,如果降低價(jià)格,則舊企業(yè)獲得90收益,而新企業(yè)無(wú)論如何都不會(huì)獲得收益。但新企業(yè)如果不入場(chǎng),舊企業(yè)就不會(huì)選擇降價(jià),所以在博弈樹上,新企業(yè)的“do not enter”下沒(méi)有多的分支。
與該博弈類似的還有“協(xié)調(diào)博弈”,即每個(gè)參與者的收益取決于他們與對(duì)方的協(xié)調(diào)程度,如果選擇同樣的策略,雙方獲得相同的收益,如果選擇了不同的收益,那么雙方獲得相同的虧損,博弈的目的是使每位參與者的收益最大化。而該博弈中可能存在多個(gè)納什均衡。
這里要特別解釋一下表格中對(duì)策略的描述:(L,L)是指,第一個(gè)L對(duì)應(yīng)A的第一個(gè)策略,當(dāng)A選擇L時(shí),那么B選擇第一個(gè)策略,當(dāng)A選擇S時(shí),那么B選擇第二個(gè)策略,例如:(S,L):A選擇L時(shí),B選擇S,A選擇S時(shí),B選擇L。由此我們根據(jù)右邊的博弈樹,得到左邊的收益表格。利用畫線法可以得到三個(gè)均衡,分別是:A選L時(shí)B選L;A選L時(shí)B選L;A選S時(shí)B選S。與協(xié)調(diào)博弈的要求相符。
當(dāng)對(duì)博弈樹分析納什均衡時(shí),可以采用“逆向歸納”法:
從最終的結(jié)果開始分析,倒推回最初的策略。舉圖片中的例子:對(duì)于所有的結(jié)果,由于最后一步由2決定,那么就要比較2的收益。在左邊的分支中,(2,1)和(0,0)相比,1大于0,那么選擇(2,1),在分支上畫一個(gè)倒回的箭頭,右側(cè)同理選擇(3,2),此時(shí)回到第一步,也即1的選擇,此時(shí)比較1的收益大小,(2,1)和(3,2)中3大于2,則選擇(3,2),在右側(cè)畫一個(gè)倒推回的箭頭指向最初的1,綜上,最終得到的納什均衡為(3,2)。
另一種擴(kuò)展式博弈是重復(fù)博弈,參與者重復(fù)進(jìn)行同一種博弈,最終每次博弈的收益是所有收益的的加權(quán)平均數(shù)。對(duì)于重復(fù)博弈來(lái)說(shuō),可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈,但整體而言是動(dòng)態(tài)博弈,后一次博弈不會(huì)受到前一次博弈的影響,每一次博弈的規(guī)則、策略等均完全相同。