∑q′Pr( A n+1 = an+1 | an , q′) Pr( q′_中国高校课件下载中心

点击下载：东北师范大学：【学术论文 - 智能系统】规划识别的研究及其应用（谷文祥、李丽、李丹丹）

正在加载图片...

6 智能系统学报第2卷 >Pr(A=anl an.9)Pr(g'l q.ab.an. E可以采用如下方法计算： 1) E(A =p(Resuilt (A)Do(A).BU(Result(A ) Prto'=g'l q.a.1o,.an1,In1)=apr(Inti In, 式中：A为某一非确定行动，它具有可能的结果状态 g)Pr(antl an.q)Pr(o'=g'l q.a,l,.an.In). Result,(A);i为索引，最大不超过不同结果的个数在执行A之前，智能体为每个结果赋以概率P(Re 式中：a为常化因子 sult,(A)川Do(A),E),其中E综合了智能体关于世该方法在训练过程中确定条件概率分布，因此界的可用证据，Do(A)是在当前状态下执行动作A 能够依据所观察到的行为动态构建概率分布.在训的命题.而最大期望效用(MEU原则指出，一个理练和测试过程中允许不完整的、零散的或带有噪声性智能体应该选择能最大化该智能体的期望效用的的数据存在.Albrecht等人用大量数据进行的试验那个行动2 表明该方法具有很高的预测准确度，虽然该方法是概率理论是在证据的基础上，描述一个智能体在游戏领域进行的实验，但在具有相似特征的领域应该相信什么；而效用理论描述一个智能体想要什中，该方法也非常适用，并且能够取得很好的效果. 么；决策理论则将两者结合起来以描述一个智能体 Horvitz等人也将贝叶斯网络应用到了规划识应该做什么.因此，将决策理论方法应用到规划识别别当中s).他们的Lumiere工程通过建立贝叶斯用领域中，从规划智能体的角度来进行决策分析，必将户模型来推测用户的需求，并考虑用户的背景、动作会得到更合理化的识别结果及问题查询.Lumiere工程的主要任务是构建贝叶 Mao Wenji和Jonathan Gratch认为规划识别斯用户模型，用于从所观察到的动作和查询上推理可以被看作是在为模型化另一个智能体的决策制定出计算机用户随时间变化的目标；从软件应用中获策略]，之前的方法只是向规划识别中添加概率，取事件流；开发可以将系统事件转化为贝叶斯用户却缺少了对效用值的应用.因此，他们提出了规划识模型中所表达的观察变量，开发持续简档(profile) 别的一种新方法，即通过最大期望效用来判断某一以获取用户技能的变化；为智能用户接口开发一个智能体所执行的规划.他们的规划采用经典总体结构.该工程是office助手的基础，其目的主要 STRIPS的一种扩展表示，允许概率条件效果及抽是观察程序状态、动作序列及用户查询词语，并根据象动作.其规划识别方法有2种效用值节点，分别为这些观察结果识别出用户的需求或目标，辅助用户规划效用值节点和结果效用值节点.向贝叶斯网络达到其最终目标.他们的决策模型包括用户的目标中添加这2种节点，把计算出的结果作为证据来调和需求，其中目标是指用户关注的目的任务或子任整概率分布以便选择期待的结果.在规划识别过程务；需求是指能减少用户完成任务的时间或工作量中，遇到2个规划的先验概率及后验概率均相同的的信息或动作.该模型在规划识别的过程中能够推情况时，识别器可根据两个规划不同的效用值，即执断用户需要帮助的可能性及需要帮助的类型.Hor 行规划的智能体对2规划的偏好来选择出更合理的 vtz等人还将用户的证据分为如下几类：搜索、专规划作为识别结果.而以往的概率规划识别由于没注、反省、非期待效果、非高效命令序列、域特征句法有考虑到状态的期望值，因此不能做出这种合理的和语义.根据用户证据，可以识别出用户的目标以及区分是否需要帮助 2.9基于动态概率关系模型的规划识别由于不确定性无处不在，而动态贝叶斯网络又 1999年，Friedman等人提出了概率关系模是建立在概率方法基础之上的，因此，采用动态贝叶型.他们认为，己有的数据学习方法的数据表达斯网络可以有效地诊断出用户的需求，并向用户提方式都太过单调，不能很好地学习数据库中所存储供有用的帮助.该方法在实际应用中效果很好的知识，因此要用这些方法来表达数据库中的数据 2.8基于决策理论方法的规划识别必然会丢失大量的关系结构信息.Friedman等人提效用理论认为，任何状态对一个智能体而言都出了概率关系模型(PRM),用这种方法来对数据库有一定程度的有用性，即效用.智能体会偏好具有更中的信息进行学习.概率关系模型允许某一对象的高效用的状态.决策网络是贝叶斯网络的一个扩展，属性与该对象本身的其他属性有概率依赖关系，还它将贝叶斯网络与行动以及效用的附加节点类型结允许某一对象的属性与其相关对象的属性有概率依合起来赖关系.因此概率关系模型的表达能力要强于一般给定证据E,某一行动A的期望效用EU(A| 的标准模型（如贝叶斯网络）.为了从大型数据库中 1994-2009 China Academie Journal Electronic Publishing House.All rights reserved.http://www.cnki.net∑q′Pr( A n+1 = an+1 | an , q′) Pr( q′| q , a0 , l0 , …, an , ln ) , Pr( Q′= q′| q , a0 , l0 , …, an+1 , ln+1 ) =αPr( l n+1 | ln , q′) Pr( an+1 | an , q′) Pr( Q′= q′| q , a0 , l0 , …, an , ln ) . 式中 :α为常化因子. 该方法在训练过程中确定条件概率分布 ,因此能够依据所观察到的行为动态构建概率分布. 在训练和测试过程中允许不完整的、零散的或带有噪声的数据存在. Albrecht 等人用大量数据进行的试验表明该方法具有很高的预测准确度. 虽然该方法是在游戏领域进行的实验 ,但在具有相似特征的领域中 ,该方法也非常适用 ,并且能够取得很好的效果. Horvitz 等人也将贝叶斯网络应用到了规划识别当中[31 ] . 他们的 Lumiere 工程通过建立贝叶斯用户模型来推测用户的需求 ,并考虑用户的背景、动作及问题查询. Lumiere 工程的主要任务是构建贝叶斯用户模型 ,用于从所观察到的动作和查询上推理出计算机用户随时间变化的目标 ;从软件应用中获取事件流 ;开发可以将系统事件转化为贝叶斯用户模型中所表达的观察变量 ;开发持续简档 (profile) 以获取用户技能的变化 ;为智能用户接口开发一个总体结构. 该工程是 office 助手的基础 ,其目的主要是观察程序状态、动作序列及用户查询词语 ,并根据这些观察结果识别出用户的需求或目标 ,辅助用户达到其最终目标. 他们的决策模型包括用户的目标和需求 ,其中目标是指用户关注的目的任务或子任务 ;需求是指能减少用户完成任务的时间或工作量的信息或动作. 该模型在规划识别的过程中能够推断用户需要帮助的可能性及需要帮助的类型. Hor2 vitz 等人还将用户的证据分为如下几类 :搜索、专注、反省、非期待效果、非高效命令序列、域特征句法和语义. 根据用户证据 ,可以识别出用户的目标以及是否需要帮助. 由于不确定性无处不在 ,而动态贝叶斯网络又是建立在概率方法基础之上的 ,因此 ,采用动态贝叶斯网络可以有效地诊断出用户的需求 ,并向用户提供有用的帮助. 该方法在实际应用中效果很好. 218 基于决策理论方法的规划识别效用理论认为 ,任何状态对一个智能体而言都有一定程度的有用性 ,即效用. 智能体会偏好具有更高效用的状态. 决策网络是贝叶斯网络的一个扩展 , 它将贝叶斯网络与行动以及效用的附加节点类型结合起来. 给定证据 E,某一行动 A 的期望效用 EU ( A | E) 可以采用如下方法计算 : EU(A | E) = ∑i p(Result(A) | Do(A) , E)U (Result ( A ) ) . 式中 :A 为某一非确定行动 ,它具有可能的结果状态 Resulti ( A) ; i 为索引 ,最大不超过不同结果的个数. 在执行 A 之前 ,智能体为每个结果赋以概率 P(Re2 sulti ( A) | Do( A) , E) ,其中 E 综合了智能体关于世界的可用证据 , Do( A) 是在当前状态下执行动作 A 的命题. 而最大期望效用 ( M EU) 原则指出 ,一个理性智能体应该选择能最大化该智能体的期望效用的那个行动[32 ] . 概率理论是在证据的基础上 ,描述一个智能体应该相信什么;而效用理论描述一个智能体想要什么;决策理论则将两者结合起来以描述一个智能体应该做什么. 因此 ,将决策理论方法应用到规划识别领域中 ,从规划智能体的角度来进行决策分析 ,必将会得到更合理化的识别结果. Mao Wenji 和 Jonat han Gratch 认为规划识别可以被看作是在为模型化另一个智能体的决策制定策略[33 ] . 之前的方法只是向规划识别中添加概率 , 却缺少了对效用值的应用. 因此 ,他们提出了规划识别的一种新方法 ,即通过最大期望效用来判断某一智能体所执行的规划. 他们的规划采用经典 STRIPS 的一种扩展表示 ,允许概率条件效果及抽象动作. 其规划识别方法有 2 种效用值节点 ,分别为规划效用值节点和结果效用值节点. 向贝叶斯网络中添加这 2 种节点 ,把计算出的结果作为证据来调整概率分布以便选择期待的结果. 在规划识别过程中 ,遇到 2 个规划的先验概率及后验概率均相同的情况时 ,识别器可根据两个规划不同的效用值 ,即执行规划的智能体对 2 规划的偏好来选择出更合理的规划作为识别结果. 而以往的概率规划识别由于没有考虑到状态的期望值 ,因此不能做出这种合理的区分. 219 基于动态概率关系模型的规划识别 1999 年 , Friedman 等人提出了概率关系模型[34 ] . 他们认为 ,已有的数据学习方法的数据表达方式都太过单调 ,不能很好地学习数据库中所存储的知识 ,因此要用这些方法来表达数据库中的数据必然会丢失大量的关系结构信息. Friedman 等人提出了概率关系模型(PRM) ,用这种方法来对数据库中的信息进行学习. 概率关系模型允许某一对象的属性与该对象本身的其他属性有概率依赖关系 ,还允许某一对象的属性与其相关对象的属性有概率依赖关系. 因此概率关系模型的表达能力要强于一般的标准模型(如贝叶斯网络) . 为了从大型数据库中 ·6 · 智能系统学报第 2 卷

<<向上翻页向下翻页>>

点击下载：东北师范大学：【学术论文 - 智能系统】规划识别的研究及其应用（谷文祥、李丽、李丹丹）