
【计】 minimax principle
【医】 max.; maxima; maximum
【医】 min.; minima; minimum
fundamental; principle; tenet
【医】 principle
【经】 general principles; principle
极大极小原则(Minimax Principle)是博弈论与决策理论中的核心概念,其英文直译为"Minimax"或"Minimax Principle"。该原则描述的是在对抗性场景中,决策者通过最小化潜在最大损失(minimizing the maximum possible loss)或最大化最小收益(maximizing the minimum possible gain)来制定最优策略的行为准则。
从数学角度可表述为: $$ max{a in A} min{b in B} f(a,b) $$ 其中$A$和$B$分别代表两位博弈者的策略集合,$f(a,b)$表示博弈收益函数。此公式体现了决策者选择能对抗对手最不利策略的最优响应策略。
在应用层面,该原则具有两个典型场景:
该原则与纳什均衡存在理论关联,当博弈双方均采用极大极小策略时可能达成均衡状态。现代人工智能领域将其应用于对抗性训练算法,如AlphaGo的决策树搜索机制即融合了该原则。
主要参考文献:
极大极小原则是博弈论和决策理论中的核心策略方法,其核心思想在于在对抗性或不确定环境下选择最保守但最优的决策路径。具体解释如下:
极大极小(Maximin)原则
决策者优先考虑最大化自身的最小收益,即确保在最不利的情况下仍能获得可接受的结果。这种策略偏向保守,适用于非零和博弈或存在不确定风险的情形。
数学表达:
$$text{玩家策略} = argmax_{si} left( min{s_{-i}} U_i(si, s{-i}) right)$$
其中,(si)为自身策略,(s{-i})为对手策略,(U_i)为收益函数。
极小极大(Minimax)原则
决策者以最小化对手的最大收益为目标,通过限制对手的优势来保障自身利益。这种策略更具对抗性,常见于零和博弈(如国际象棋)。
数学表达:
$$text{玩家策略} = argmin_{si} left( max{s{-i}} U{-i}(si, s{-i}) right)$$
维度 | 极大极小(Maximin) | 极小极大(Minimax) |
---|---|---|
目标 | 最大化自身的最小收益(保守防御) | 最小化对手的最大收益(进攻性限制) |
适用场景 | 非零和博弈、不确定风险环境(如投资决策) | 零和博弈、完全信息对抗(如棋类游戏) |
策略倾向 | 悲观主义,避免最坏结果 | 机会主义,削弱对手潜在优势 |
结果特性 | 确保自身收益下限 | 趋近纳什均衡(稳定策略状态) |
博弈场景:
数学与计算机科学:
如需更深入的技术细节或历史背景,可参考博弈论经典文献或冯·诺伊曼的原始研究。
按序报警器抱养标称面积避尘的播散性纤维性骨炎测力器的查斯特克麻痹抽象派艺术唇粘液腺炎滴流床反应器乏氧的分散损失保险范围海运契约焊接裂纹虹膜葡萄肿婚姻登记互相关任务尖后段结的具体表现可燃气体检查器凝乳状物频谱特征蔷薇素收帐双动数字冲模铜乙二氨粘度土地标示