正在加载图片...
6 智能系统学报 第2卷 >Pr(A=anl an.9)Pr(g'l q.ab.an. E可以采用如下方法计算: 1) E(A =p(Resuilt (A)Do(A).BU(Result(A ) Prto'=g'l q.a.1o,.an1,In1)=apr(Inti In, 式中:A为某一非确定行动,它具有可能的结果状态 g)Pr(antl an.q)Pr(o'=g'l q.a,l,.an.In). Result,(A);i为索引,最大不超过不同结果的个数 在执行A之前,智能体为每个结果赋以概率P(Re 式中:a为常化因子 sult,(A)川Do(A),E),其中E综合了智能体关于世 该方法在训练过程中确定条件概率分布,因此 界的可用证据,Do(A)是在当前状态下执行动作A 能够依据所观察到的行为动态构建概率分布.在训 的命题.而最大期望效用(MEU原则指出,一个理 练和测试过程中允许不完整的、零散的或带有噪声 性智能体应该选择能最大化该智能体的期望效用的 的数据存在.Albrecht等人用大量数据进行的试验 那个行动2 表明该方法具有很高的预测准确度,虽然该方法是 概率理论是在证据的基础上,描述一个智能体 在游戏领域进行的实验,但在具有相似特征的领域 应该相信什么;而效用理论描述一个智能体想要什 中,该方法也非常适用,并且能够取得很好的效果. 么;决策理论则将两者结合起来以描述一个智能体 Horvitz等人也将贝叶斯网络应用到了规划识 应该做什么.因此,将决策理论方法应用到规划识别 别当中s).他们的Lumiere工程通过建立贝叶斯用 领域中,从规划智能体的角度来进行决策分析,必将 户模型来推测用户的需求,并考虑用户的背景、动作 会得到更合理化的识别结果 及问题查询.Lumiere工程的主要任务是构建贝叶 Mao Wenji和Jonathan Gratch认为规划识别 斯用户模型,用于从所观察到的动作和查询上推理 可以被看作是在为模型化另一个智能体的决策制定 出计算机用户随时间变化的目标;从软件应用中获 策略],之前的方法只是向规划识别中添加概率, 取事件流;开发可以将系统事件转化为贝叶斯用户 却缺少了对效用值的应用.因此,他们提出了规划识 模型中所表达的观察变量,开发持续简档(profile) 别的一种新方法,即通过最大期望效用来判断某一 以获取用户技能的变化;为智能用户接口开发一个 智能体所执行的规划.他们的规划采用经典 总体结构.该工程是office助手的基础,其目的主要 STRIPS的一种扩展表示,允许概率条件效果及抽 是观察程序状态、动作序列及用户查询词语,并根据 象动作.其规划识别方法有2种效用值节点,分别为 这些观察结果识别出用户的需求或目标,辅助用户 规划效用值节点和结果效用值节点.向贝叶斯网络 达到其最终目标.他们的决策模型包括用户的目标 中添加这2种节点,把计算出的结果作为证据来调 和需求,其中目标是指用户关注的目的任务或子任 整概率分布以便选择期待的结果.在规划识别过程 务;需求是指能减少用户完成任务的时间或工作量 中,遇到2个规划的先验概率及后验概率均相同的 的信息或动作.该模型在规划识别的过程中能够推 情况时,识别器可根据两个规划不同的效用值,即执 断用户需要帮助的可能性及需要帮助的类型.Hor 行规划的智能体对2规划的偏好来选择出更合理的 vtz等人还将用户的证据分为如下几类:搜索、专 规划作为识别结果.而以往的概率规划识别由于没 注、反省、非期待效果、非高效命令序列、域特征句法 有考虑到状态的期望值,因此不能做出这种合理的 和语义.根据用户证据,可以识别出用户的目标以及 区分 是否需要帮助 2.9基于动态概率关系模型的规划识别 由于不确定性无处不在,而动态贝叶斯网络又 1999年,Friedman等人提出了概率关系模 是建立在概率方法基础之上的,因此,采用动态贝叶 型.他们认为,己有的数据学习方法的数据表达 斯网络可以有效地诊断出用户的需求,并向用户提 方式都太过单调,不能很好地学习数据库中所存储 供有用的帮助.该方法在实际应用中效果很好 的知识,因此要用这些方法来表达数据库中的数据 2.8基于决策理论方法的规划识别 必然会丢失大量的关系结构信息.Friedman等人提 效用理论认为,任何状态对一个智能体而言都 出了概率关系模型(PRM),用这种方法来对数据库 有一定程度的有用性,即效用.智能体会偏好具有更 中的信息进行学习.概率关系模型允许某一对象的 高效用的状态.决策网络是贝叶斯网络的一个扩展, 属性与该对象本身的其他属性有概率依赖关系,还 它将贝叶斯网络与行动以及效用的附加节点类型结 允许某一对象的属性与其相关对象的属性有概率依 合起来 赖关系.因此概率关系模型的表达能力要强于一般 给定证据E,某一行动A的期望效用EU(A| 的标准模型(如贝叶斯网络).为了从大型数据库中 1994-2009 China Academie Journal Electronic Publishing House.All rights reserved.http://www.cnki.net∑q′Pr( A n+1 = an+1 | an , q′) Pr( q′| q , a0 , l0 , …, an , ln ) , Pr( Q′= q′| q , a0 , l0 , …, an+1 , ln+1 ) =αPr( l n+1 | ln , q′) Pr( an+1 | an , q′) Pr( Q′= q′| q , a0 , l0 , …, an , ln ) . 式中 :α为常化因子. 该方法在训练过程中确定条件概率分布 ,因此 能够依据所观察到的行为动态构建概率分布. 在训 练和测试过程中允许不完整的、零散的或带有噪声 的数据存在. Albrecht 等人用大量数据进行的试验 表明该方法具有很高的预测准确度. 虽然该方法是 在游戏领域进行的实验 ,但在具有相似特征的领域 中 ,该方法也非常适用 ,并且能够取得很好的效果. Horvitz 等人也将贝叶斯网络应用到了规划识 别当中[31 ] . 他们的 Lumiere 工程通过建立贝叶斯用 户模型来推测用户的需求 ,并考虑用户的背景、动作 及问题查询. Lumiere 工程的主要任务是构建贝叶 斯用户模型 ,用于从所观察到的动作和查询上推理 出计算机用户随时间变化的目标 ;从软件应用中获 取事件流 ;开发可以将系统事件转化为贝叶斯用户 模型中所表达的观察变量 ;开发持续简档 (profile) 以获取用户技能的变化 ;为智能用户接口开发一个 总体结构. 该工程是 office 助手的基础 ,其目的主要 是观察程序状态、动作序列及用户查询词语 ,并根据 这些观察结果识别出用户的需求或目标 ,辅助用户 达到其最终目标. 他们的决策模型包括用户的目标 和需求 ,其中目标是指用户关注的目的任务或子任 务 ;需求是指能减少用户完成任务的时间或工作量 的信息或动作. 该模型在规划识别的过程中能够推 断用户需要帮助的可能性及需要帮助的类型. Hor2 vitz 等人还将用户的证据分为如下几类 :搜索、专 注、反省、非期待效果、非高效命令序列、域特征句法 和语义. 根据用户证据 ,可以识别出用户的目标以及 是否需要帮助. 由于不确定性无处不在 ,而动态贝叶斯网络又 是建立在概率方法基础之上的 ,因此 ,采用动态贝叶 斯网络可以有效地诊断出用户的需求 ,并向用户提 供有用的帮助. 该方法在实际应用中效果很好. 218 基于决策理论方法的规划识别 效用理论认为 ,任何状态对一个智能体而言都 有一定程度的有用性 ,即效用. 智能体会偏好具有更 高效用的状态. 决策网络是贝叶斯网络的一个扩展 , 它将贝叶斯网络与行动以及效用的附加节点类型结 合起来. 给定证据 E,某一行动 A 的期望效用 EU ( A | E) 可以采用如下方法计算 : EU(A | E) = ∑i p(Result(A) | Do(A) , E)U (Result ( A ) ) . 式中 :A 为某一非确定行动 ,它具有可能的结果状态 Resulti ( A) ; i 为索引 ,最大不超过不同结果的个数. 在执行 A 之前 ,智能体为每个结果赋以概率 P(Re2 sulti ( A) | Do( A) , E) ,其中 E 综合了智能体关于世 界的可用证据 , Do( A) 是在当前状态下执行动作 A 的命题. 而最大期望效用 ( M EU) 原则指出 ,一个理 性智能体应该选择能最大化该智能体的期望效用的 那个行动[32 ] . 概率理论是在证据的基础上 ,描述一个智能体 应该相信什么;而效用理论描述一个智能体想要什 么;决策理论则将两者结合起来以描述一个智能体 应该做什么. 因此 ,将决策理论方法应用到规划识别 领域中 ,从规划智能体的角度来进行决策分析 ,必将 会得到更合理化的识别结果. Mao Wenji 和 Jonat han Gratch 认为规划识别 可以被看作是在为模型化另一个智能体的决策制定 策略[33 ] . 之前的方法只是向规划识别中添加概率 , 却缺少了对效用值的应用. 因此 ,他们提出了规划识 别的一种新方法 ,即通过最大期望效用来判断某一 智能 体 所 执 行 的 规 划. 他 们 的 规 划 采 用 经 典 STRIPS 的一种扩展表示 ,允许概率条件效果及抽 象动作. 其规划识别方法有 2 种效用值节点 ,分别为 规划效用值节点和结果效用值节点. 向贝叶斯网络 中添加这 2 种节点 ,把计算出的结果作为证据来调 整概率分布以便选择期待的结果. 在规划识别过程 中 ,遇到 2 个规划的先验概率及后验概率均相同的 情况时 ,识别器可根据两个规划不同的效用值 ,即执 行规划的智能体对 2 规划的偏好来选择出更合理的 规划作为识别结果. 而以往的概率规划识别由于没 有考虑到状态的期望值 ,因此不能做出这种合理的 区分. 219 基于动态概率关系模型的规划识别 1999 年 , Friedman 等人提出 了概率关 系模 型[34 ] . 他们认为 ,已有的数据学习方法的数据表达 方式都太过单调 ,不能很好地学习数据库中所存储 的知识 ,因此要用这些方法来表达数据库中的数据 必然会丢失大量的关系结构信息. Friedman 等人提 出了概率关系模型(PRM) ,用这种方法来对数据库 中的信息进行学习. 概率关系模型允许某一对象的 属性与该对象本身的其他属性有概率依赖关系 ,还 允许某一对象的属性与其相关对象的属性有概率依 赖关系. 因此概率关系模型的表达能力要强于一般 的标准模型(如贝叶斯网络) . 为了从大型数据库中 ·6 · 智 能 系 统 学 报 第 2 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有