当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

西安电子科技大学:《智能控制导论》课程教学课件(博弈控制)第六讲 动态博弈分析(上)

资源类别:文库,文档格式:PDF,文档页数:20,文件大小:768.91KB,团购合买
• 概念 • 动态博弈的扩展式表述 • 动态博弈的策略式表述 • 基于动态博弈的控制系统
点击下载完整版文档(PDF)

功态博弈分析 ·概念 ·动态博弈的扩展式表述 ·动态博弈的策略式表述 ·基于动态博弈的控制系统

动态博弈分析 • 概念 • 动态博弈的扩展式表述 • 动态博弈的策略式表述 • 基于动态博弈的控制系统

动态博弈的概念 ·动态博弈(dynamic game)是指参与人的行动有先后顺序,而 且行动在后者可以观察到行动在先者的选择,并据此作出 相应的选择。 开发 不开发 N 小(1/2) 大(1/2 小(1/2 大1/2) B B 开发 开为 开发 开发 不开发 开发 开发 (4,4) (8,0)(-3,-3)(1,0)(0,8) (0,0)(0,1)(0,0)

动态博弈的概念 • 动态博弈(dynamic game)是指参与人的行动有先后顺序,而 且行动在后者可以观察到行动在先者的选择,并据此作出 相应的选择

动态博弈的表述:动态博弈要素 0 参与人集合,动态博弈中还常用N表示虚拟 的参与人“自然”。 >“自然”代表某些影响博弈的外在客观概率分 布事件。 ·参与人的行动顺序:表述各参与人在什么 时候行动。 ·参与人的策略空间:在每次行动时,参与 人的可选策略集合

动态博弈的表述:动态博弈要素 • 参与人集合,动态博弈中还常用N表示虚拟 的参与人“自然”。 “自然”代表某些影响博弈的外在客观概率分 布事件。 • 参与人的行动顺序:表述各参与人在什么 时候行动。 • 参与人的策略空间:在每次行动时,参与 人的可选策略集合

动态博弈的表述:动态博弈要素 0 参与人的收益函数:每次行动结束后,参 与人可计算出自己得到了什么。 ·“自然”的概率分布:假定“自然”的概 率分布为共同知识

动态博弈的表述:动态博弈要素 • 参与人的收益函数:每次行动结束后,参 与人可计算出自己得到了什么。 • “自然”的概率分布:假定“自然”的概 率分布为共同知识

动态博弈的表述:博弈树 ·例:商品仿冒和反仿冒动态博弈的博弈树 表述 仿 不仿冒 )(0,10) 不制止 (-25) 仿冒 不仿冒 (5,5) 不制止 (2,2 (10,4

动态博弈的表述:博弈树 • 例:商品仿冒和反仿冒动态博弈的博弈树 表述

动态博弈的表述:博弈树 ·包括“自然”选择的动态博弈:房地产开 发,其中市场需求的大小不知道。 A 开发 不开发 小(1/2) 大(1/2) 小(1/2 大1/2) B 开发 开月 开发 开发 开发 开发 (4,4) (8,0)(3,-3)(1,0)(0,8) (0,0)(0,1) (0,0)

动态博弈的表述:博弈树 • 包括“自然”选择的动态博弈:房地产开 发,其中市场需求的大小不知道

动态博弈的表述:博弈树的基本要素 ·节点:包括决策节和终点节。 >决策节是参与人采取行动的时间点。 >起始节:不存在前续节的节点 >节X的后续节:到达X之后才有可能在后续的博弈中 到达的节。 >节X的前续节:在可能到达X之前必须到达的节。 >终点节是博弈的时间点

动态博弈的表述:博弈树的基本要素 • 节点:包括决策节和终点节。 决策节是参与人采取行动的时间点。 起始节:不存在前续节的节点 节X的后续节:到达X之后才有可能在后续的博弈中 到达的节。 节X的前续节:在可能到达X之前必须到达的节。 终点节是博弈的时间点

动态博弈的表述:博弈树的基本要素 ·枝:从一个决策节到他的直接后续决策节 或终点节的连线,每一个枝代表一个参与 人的一个行动。 ·路径:从起始节到终点节由节和枝组成的 途径

动态博弈的表述:博弈树的基本要素 • 枝:从一个决策节到他的直接后续决策节 或终点节的连线,每一个枝代表一个参与 人的一个行动。 • 路径:从起始节到终点节由节和枝组成的 途径

动态博弈的表述:博弈树的基本要素 信息集:是决策节集合的子集。博弈树中某一决策者在某一行动阶段 具有相同信息的所有决策节点称为一个信息集。 >同一个信息集中的决策节是同一参与人的决策节。 >如果信息集中有多个节点, 开发 不开发 参与人知道进入该信息集 的某个决策节,但不能确 小(1/2) 大(1/2 小(1/2) 大1/2 定是哪个决策节。 B2 B4 开发 开发 开发 开发 例如:开发商B不知道A选择“开发”或 发 “不开发”,则B的第一和第三个节点构 成一个信息集(B1,B3)。 4 (8,0)(-3,-3)(1,0)(0,8) (0,00,1)(0,0

动态博弈的表述:博弈树的基本要素 • 信息集:是决策节集合的子集。博弈树中某一决策者在某一行动阶段 具有相同信息的所有决策节点称为一个信息集。  同一个信息集中的决策节是同一参与人的决策节。  如果信息集中有多个节点, 参与人知道进入该信息集 的某个决策节,但不能确 定是哪个决策节。 例如:开发商B不知道A选择“开发”或 “不开发”,则B的 第一和第三个节点构 成一个信息集(B1,B3)

动态博弈的表述:博弈树 博弈树是对博弈的一种描述,它由下述几点组成: 1. 由节和枝组成的整体结构,即由单个起始节开始直至终点节,中间 无闭合的圈。 2. 有对哪个节属于哪个参与人的说明。 3. 在自然做选择的节上,有自然选择不同枝的概率。 4. 有划分每个参与人的节的信息集。 5. 在每个终点节上都有结果 如果在终点节上的结果给出的是每个参与人的收益,博弈树也可称 为扩展式

动态博弈的表述:博弈树 博弈树是对博弈的一种描述,它由下述几点组成: 1. 由节和枝组成的整体结构,即由单个起始节开始直至终点节,中间 无闭合的圈。 2. 有对哪个节属于哪个参与人的说明。 3. 在自然做选择的节上,有自然选择不同枝的概率。 4. 有划分每个参与人的节的信息集。 5. 在每个终点节上都有结果 如果在终点节上的结果给出的是每个参与人的收益,博弈树也可称 为扩展式

点击下载完整版文档(PDF)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共20页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有