
对策论(Game Theory),中文又称博弈论,是数学的一个分支,专门研究具有竞争或合作关系的决策主体(个人或团体)在特定规则下,如何根据其他主体的策略选择来制定自身最优策略的理论框架。其核心在于分析理性决策者之间的策略互动及其均衡结果。
从汉英词典角度理解,“对策”对应英文中的“strategy”或“move”,指决策者选择的行动方案;“论”即“theory”,指系统化的研究。因此,“对策论”直译为“Strategy Theory”,但国际通用术语为“Game Theory”。
核心概念解析:
决策主体(Players)
指参与策略互动的个体或组织,如企业、国家、个人等。每个主体均追求自身目标(如利润最大化、损失最小化)。
策略(Strategies)
指决策主体可选择的完整行动计划。策略集合定义了所有可能的行动方案。
收益(Payoffs)
指决策主体在特定策略组合下获得的效用或结果(如利润、效用值)。收益矩阵常用于表示不同策略组合下的结果。
均衡(Equilibrium)
指所有决策主体均无激励单方面改变策略的稳定状态。最著名的是纳什均衡(Nash Equilibrium),即给定其他主体策略不变,任何主体都无法通过独自改变策略获得更高收益。
信息结构(Information Structure)
分为完全信息(所有主体知晓规则、收益)与不完全信息(部分信息未知),影响策略制定。
典型模型示例:
经典非合作博弈模型,揭示个体理性选择可能导致集体非最优结果。
收益矩阵示例:
$$ begin{array}{c|c|c} & text{合作(沉默)} & text{背叛(揭发)} hline text{合作(沉默)} & (-1,-1) & (-10,0) hline text{背叛(揭发)} & (0,-10) & (-5,-5) end{array} $$
(纳什均衡:双方均选择背叛)
学科地位与应用领域:
对策论是微观经济学、政治学、计算机科学(如人工智能)、生物学(演化博弈)的核心工具。广泛应用于拍卖设计、市场竞争分析、国际谈判、网络安全策略等场景。
权威参考来源:
对策论(Game Theory),又称博弈论,是研究多个决策主体(参与者)在竞争或合作情境中如何制定策略,并分析其结果的数学理论。它广泛应用于经济学、政治学、生物学、计算机科学等领域,旨在预测理性个体的行为并寻找最优决策方案。
参与者(Players)
决策主体,可以是个人、企业、国家等。每个参与者通过策略选择追求自身利益最大化。
策略(Strategies)
参与者在博弈中可采取的行动方案。例如,在“囚徒困境”中,两名嫌疑人的策略是“沉默”或“揭发”。
收益(Payoffs)
参与者根据策略组合获得的效用或结果,通常用矩阵或函数表示。例如,若两名囚徒均沉默,各判1年;若一方揭发,揭发者释放,另一方判10年。
纳什均衡(Nash Equilibrium)
参与者策略组合达到稳定状态,任何一方单方面改变策略都无法获得更高收益。例如,在“囚徒困境”中,(揭发,揭发)是纳什均衡。
合作博弈与非合作博弈
合作博弈允许参与者达成有约束力的协议(如联盟),非合作博弈则聚焦个体独立决策(如市场竞争)。
完全信息与不完全信息博弈
完全信息下,参与者了解彼此的收益和策略;不完全信息则存在信息不对称(如拍卖竞价)。
静态博弈与动态博弈
静态博弈中参与者同时决策(如投标),动态博弈中行动有先后顺序(如棋类游戏)。
两名共谋罪犯被分开审讯,可选择合作(沉默)或背叛(揭发)。尽管合作总体刑期更短,但个体理性导致双方选择背叛,形成非最优的纳什均衡。这一悖论揭示了个人理性与集体理性的矛盾。
对策论通过数学模型揭示复杂交互中的策略规律,是理解人类行为和社会现象的重要工具。如需进一步学习,可参考经典著作《博弈论与经济行为》(冯·诺依曼和摩根斯顿)。
八的倍半矽酸钠出现脓头大众银行店铺掉期感应协调雇员关系何勒内斯数据红色细菌属厚壁的花瓶角铁剧场利率低洛派丁胺马嘶面向科学的判明破坏性存储器普鲁萨克氏间隙前括号上面杀蛙杆菌视幻象瞬时错误弹簧铜霉素外围设备表唯象系数