序貫理性是指每個參與人在其每一個行動時點上都將重新優(yōu)化自己的選擇,并且會把自己將來會重新優(yōu)化其選擇這一點也納入當(dāng)前的優(yōu)化選擇當(dāng)中。
基本內(nèi)容序貫決策是指按時間順序排列起來,以得到按順序的各種決策(策略),是用于隨機(jī)性或不確定性動態(tài)系統(tǒng)最優(yōu)化的決策方法。
一個具備序貫理性的參與人很清楚自己在每一個需要作出決定的時刻都需要對已有的決策進(jìn)行優(yōu)化,而且在做這種優(yōu)化的時候必須把未來需要重新優(yōu)化的這一事實考慮在現(xiàn)有的優(yōu)化決策當(dāng)中。
生活中難以達(dá)到序貫理性原因是:
人們的計算能力是有限的;
人們的理性本身也是有限的(比如感情用事、沖動行事、冒險傾向等)。1
舉例用策略式(或稱為標(biāo)準(zhǔn)式)表示靜態(tài)博弈,用擴(kuò)展式表示動態(tài)或多階段博弈,描述博弈中的序列結(jié)構(gòu)。策略式博弈中的參與人的策略一旦制定,不再改變。擴(kuò)展式博弈中的參與人有序貫理性:
參與人可以在博弈的每一個時點重新制定策略;
參與人知道未來可以優(yōu)化自已的策略。1
實際應(yīng)用序貫決策方法廣泛應(yīng)用于物流配送車輛調(diào)度、家電產(chǎn)品運營、應(yīng)急資源配置等情況。應(yīng)用序貫決策方法,可大大減少計算量。同時,對于給定的動態(tài)系統(tǒng)而言,初始狀態(tài)向量為已知,系統(tǒng)經(jīng)過相當(dāng)長時間運行后,所選擇的一序列方案,是每一階段的平均收益最大的方案。
在生活中,按照逆向歸納法,我們就能找出下棋時的均衡路徑,這樣我們就分不出高下,只能成為平手。然而,現(xiàn)實中勝負(fù)是常見的。其本質(zhì)就在于對手之間的序貫理性是不一樣,他們對局勢的洞察力是不一樣的。有經(jīng)驗的老手,眼光顯然比一個新手強上不止幾百倍。2
本詞條內(nèi)容貢獻(xiàn)者為:
武偉 - 高級工程師 - 天津直升機(jī)有限責(zé)任公司