正在加载图片...
零和游戏 一个矩阵A P s R “行玩家”选一行 P 0 -1 1 “列玩家”选一列c -1 行玩家得到的回报是A,c,列玩家得到-Ar,c R 0 行玩家的目标是最大化A,c,而列玩家目标是最小化Ar,c 纳什均衡:即使一个玩家知道对方的策略之后,他/她也不能找到比 当前策略严格更优的策略。 单纯的策略(pure strategy):选一行/列 混合的策略(mixed strategy):单纯策略的一个概率分布 2零和游戏 一个矩阵� • “行玩家”选一行r • “列玩家”选一列c 行玩家得到的回报是�!,#,列玩家得到−�!,# 行玩家的目标是最大化 �!,#,而列玩家目标是最小化�!,# 纳什均衡:即使一个玩家知道对方的策略之后,他/她也不能找到比 当前策略严格更优的策略。 单纯的策略(pure strategy):选一行/列 混合的策略(mixed strategy):单纯策略的一个概率分布 2
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有