
【计】 policy function
strategy; maneuver; plan; device; game; policy; resource; tactic
【经】 strategy; tactics
function
【计】 F; FUNC; function
在汉英词典视角下,“策略函数”(Strategy Function)指代一种将特定情境或状态映射到对应行动方案的数学或逻辑规则。其核心含义可拆解为:
指为实现目标而制定的系统性方法或决策计划,强调动态调整性(如“博弈策略”“商业策略”)。
来源:《现代汉语词典》(第7版)商务印书馆
在数学与计算机科学中定义为:
$$ s: S to A $$
其中 $S$ 为状态集合,$A$ 为行动集合,函数 $s$ 为从状态到最优行动的映射规则。
来源:Russell, S., & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th ed.), Pearson Education.
描述参与者根据对手行为选择最优响应的函数,例如纳什均衡中的策略映射。
来源:Myerson, R. B. (1991). Game Theory: Analysis of Conflict, Harvard University Press.
智能体通过策略函数 $ pi(a|s) $ 决定在状态 $s$ 下采取行动 $a$ 的概率,以最大化累积奖励。
来源:Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction, MIT Press.
系统控制器根据实时状态生成控制指令的函数,如PID控制器中的策略式调节。
来源:Åström, K. J., & Murray, R. M. (2021). Feedback Systems: An Introduction for Scientists and Engineers, Princeton University Press.
“策略函数”本质是连接状态与行动的决策映射机制,其汉英释义需兼顾中文“策略”的谋略属性与英文“Function”的数学形式化特征,跨学科应用进一步丰富了其内涵边界。
“策略函数”是一个在不同学科中有不同含义的学术术语,主要出现在博弈论、数学优化和机器学习(尤其是强化学习)领域。以下是详细解释:
博弈论中的策略函数
强化学习中的策略函数
数学优化中的策略函数
核心作用:策略函数通过形式化决策规则,为复杂环境中的行为选择提供数学模型。在博弈论中体现战略互动,在强化学习中实现经验驱动的行为优化,在数学优化中服务于多阶段决策系统。
保持冷静贝滕多夫氏试验边界值表达式求值承租登基电谐振垫整电容器短指跟舟跖侧韧带固定软件记录组经济原则局部视图抗溶素块载入雷诺氏坏疽联合成本路德维希氏角难辩认的尿道窥器牛顿第三定律扑粪蝇氰化铯醛式氢水下贮罐蜕皮抑止激素椭圆形红细胞外部检查微调