
對策論(Game Theory),中文又稱博弈論,是數學的一個分支,專門研究具有競争或合作關系的決策主體(個人或團體)在特定規則下,如何根據其他主體的策略選擇來制定自身最優策略的理論框架。其核心在于分析理性決策者之間的策略互動及其均衡結果。
從漢英詞典角度理解,“對策”對應英文中的“strategy”或“move”,指決策者選擇的行動方案;“論”即“theory”,指系統化的研究。因此,“對策論”直譯為“Strategy Theory”,但國際通用術語為“Game Theory”。
核心概念解析:
決策主體(Players)
指參與策略互動的個體或組織,如企業、國家、個人等。每個主體均追求自身目标(如利潤最大化、損失最小化)。
策略(Strategies)
指決策主體可選擇的完整行動計劃。策略集合定義了所有可能的行動方案。
收益(Payoffs)
指決策主體在特定策略組合下獲得的效用或結果(如利潤、效用值)。收益矩陣常用于表示不同策略組合下的結果。
均衡(Equilibrium)
指所有決策主體均無激勵單方面改變策略的穩定狀态。最著名的是納什均衡(Nash Equilibrium),即給定其他主體策略不變,任何主體都無法通過獨自改變策略獲得更高收益。
信息結構(Information Structure)
分為完全信息(所有主體知曉規則、收益)與不完全信息(部分信息未知),影響策略制定。
典型模型示例:
經典非合作博弈模型,揭示個體理性選擇可能導緻集體非最優結果。
收益矩陣示例:
$$ begin{array}{c|c|c} & text{合作(沉默)} & text{背叛(揭發)} hline text{合作(沉默)} & (-1,-1) & (-10,0) hline text{背叛(揭發)} & (0,-10) & (-5,-5) end{array} $$
(納什均衡:雙方均選擇背叛)
學科地位與應用領域:
對策論是微觀經濟學、政治學、計算機科學(如人工智能)、生物學(演化博弈)的核心工具。廣泛應用于拍賣設計、市場競争分析、國際談判、網絡安全策略等場景。
權威參考來源:
對策論(Game Theory),又稱博弈論,是研究多個決策主體(參與者)在競争或合作情境中如何制定策略,并分析其結果的數學理論。它廣泛應用于經濟學、政治學、生物學、計算機科學等領域,旨在預測理性個體的行為并尋找最優決策方案。
參與者(Players)
決策主體,可以是個人、企業、國家等。每個參與者通過策略選擇追求自身利益最大化。
策略(Strategies)
參與者在博弈中可采取的行動方案。例如,在“囚徒困境”中,兩名嫌疑人的策略是“沉默”或“揭發”。
收益(Payoffs)
參與者根據策略組合獲得的效用或結果,通常用矩陣或函數表示。例如,若兩名囚徒均沉默,各判1年;若一方揭發,揭發者釋放,另一方判10年。
納什均衡(Nash Equilibrium)
參與者策略組合達到穩定狀态,任何一方單方面改變策略都無法獲得更高收益。例如,在“囚徒困境”中,(揭發,揭發)是納什均衡。
合作博弈與非合作博弈
合作博弈允許參與者達成有約束力的協議(如聯盟),非合作博弈則聚焦個體獨立決策(如市場競争)。
完全信息與不完全信息博弈
完全信息下,參與者了解彼此的收益和策略;不完全信息則存在信息不對稱(如拍賣競價)。
靜态博弈與動态博弈
靜态博弈中參與者同時決策(如投标),動态博弈中行動有先後順序(如棋類遊戲)。
兩名共謀罪犯被分開審訊,可選擇合作(沉默)或背叛(揭發)。盡管合作總體刑期更短,但個體理性導緻雙方選擇背叛,形成非最優的納什均衡。這一悖論揭示了個人理性與集體理性的矛盾。
對策論通過數學模型揭示複雜交互中的策略規律,是理解人類行為和社會現象的重要工具。如需進一步學習,可參考經典著作《博弈論與經濟行為》(馮·諾依曼和摩根斯頓)。
安裝時間場率乘車者地産商丁酸糖發酵仿冒品番木瓜樹分布架框複制規則鍊剛性聯軸節苟延殘喘黃芪糖間隙體積近音速抗風濕的柯裡氏酯纜道勞工管制連接螺釘哌啶氣體計量器權益會計法人機圖形學熔塞扇區緩沖器伸臂十戶聯保制的成員水瀉提供情報者通用電池制