作. 但是回归图识别方法在处理一些动作之间的关系上还存在着一

点击下载：东北师范大学：【学术论文 - 智能系统】规划识别的研究及其应用（谷文祥、李丽、李丹丹）

正在加载图片...

智能系统学报第2卷作.但是回归图识别方法在处理一些动作之间的关应用.H.H.Bui,S.Venkatesh等人提出了一种在系上还存在着一定的问题，识别也只限制在有噪音和不确定性领域中识别智能体行为的方 STRIPS域，同时只有具有了较完整的领域知识才法)，它可跨越多层抽象，即在抽象概率推理中应可以完成相关的识别工作用抽象马尔可夫策略(abstract Markov policies, 2.12基于隐马尔可夫模型的规划识别 AMP)作为智能体行为的模型，且在动态贝叶斯网俄国统计学家安德列·马尔可夫最早深入研究络中应用概率推理，从一系列观察中推断出正确的了满足马尔可夫假设的过程—当前状态只依赖于策略.AMP是马尔可夫决策过程(MDP)一个策略过去有限的已出现的状态历史.马尔可夫假设最初的扩展.原始的MDP被模型化为2层：原始动作层是用来解决随机过程问题的.随着马尔可夫模型的和规划层（也就是策略）.而AMP是多层的，顶层是不断完善与成熟，近些年来一些人工智能学者把马最抽象的策略（记为x,t时刻的高层策略记为尔可夫模型引入到识别中，并将其发展成为解决识 Tx),抽象程度依次下降，底层为策略层，即原始动别问题的重要方法，其中以隐马尔可夫模型(hidden 作层.当执行上层的抽象策略时会引发下层抽象策 Markov model,HMM)为主要模型B 略的执行，依次向下直到执行到底层策略！给定隐马尔可夫模型在识别问题上受到了很大的关当前的观察序列状态系列，相应的策略识别问题注，在随后的研究中又根据不同的应用领域和情况可以形式化为计算当前策略的条件概率.在t时刻，发展了多种基于隐马尔可夫模型的方法.其中，N. 给定观察序列，AMP关心的是在当前状态下所有 Oliver,E.Horvitz和A.Garg提出了一种层隐马第k层策略的概率，这样就知道了从当前动作层尔可夫模型3I(layered hidden Markov model,LH- (k=0)到高层策略(k=)在所有抽象层上智能体 HM),提出这种表示主要是想通过减少训练和调整行为的相关信息.策略识别问题的解决还建立在信需求来分解参数空间，LHHM可以看成是对HMM 度状态(belief state)和基于状态空间区域分解的层叠.在这个层模型中，体系结构每一层都通过它 (state-space regiom based decomposition)的基础推理出的结果与下一层相连接.这种表示把问题分割为不同的层，这些层可以运行在不同的时序粒度执行高层策略x的过程可以用一个动态贝叶上，即允许从在多个特定时刻的逐点观察到不同时斯网络DBN表示，如图1，这一过程可以命名为抽序间隔的解释的时序抽象.Kevin Murphy提到了一象马尔可夫模型(abstract markov model,AMM). 种隐半马尔可夫模型1(HSMM),它是一种类马尔当状态是部分可观察时，一个观察层可以附属于一可夫模型，其主要特点是对于每个状态都可以忽略个状态层，如图1.因为状态像HMM一样被隐藏观察的序列所以得到的结果称为抽象隐马尔可夫模型(abstract 隐马尔可夫模型主要应用在语音识别、机器视 hidden Markov model).AHMM是HMM的扩展，觉（人脸检测，机器人足球）、图像处理（图像去噪、图 HMM中的单链由多层隐链代替，也可以说像识别)、人机交互系统中的人类行为的自动与半自 AHMM是动态概率网络(DPN,也称动态贝叶斯网动识别、生物医学分析(DNA/蛋白质序列分析)等络)的一种特殊形式，其中DPN是一种特殊的贝叶方面.隐马尔可夫模型因其研究的透彻性以及算法斯网络，可以处理具有时序动态变化的环境2] 的成熟性，使它在识别领域中具有很高的效率，识别 AHMM的基础是多层贝叶斯动态结构，连续2层效果好，同时也易于训练.但它也存在着一定的问之间的连接是较高层较抽象路径向较低层改进路径题，比如缺乏结构性，参数过量，在用训练数据进行的分解.智能体想要实现高层目标时，它可以通过层长而复杂的时序序列推理时，易产生数据过拟合（过层关系在不同的抽象层创建一系列子目标，直到底拟合是指模型不能拟合未来的数据).正因为HMM 层状态层，以这样的过程来实现这个高层目标.实际具有以上的缺陷才导致复杂贝叶斯网络在识别上的上AHMM的识别与AMP的识别过程在本质上是发展和应用没有区别的 2.13基于抽象策略的规划识别策略识别和AHMM都适用在大规模的空间环抽象(abstraction)在智能体规划其行为的方式境，这样的环境具有复杂的空间布局、大的状态空间上起着非常重要的作用，特别是在大的规划领域中等特点，它可以处理不满足马尔可夫假设的问题.但降低计算复杂度上，抽象显得尤为重要.有了抽象的是策略识别与AHMM识别在信度状态上的计算量规划方法，自然容易让人想到抽象在规划识别上的仍然很大，虽然也采取了一些方法降低计算复杂 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net作. 但是回归图识别方法在处理一些动作之间的关系上还存在着一定的问题 , 识别也只限制在 STRIPS 域 ,同时只有具有了较完整的领域知识才可以完成相关的识别工作. 2112 基于隐马尔可夫模型的规划识别俄国统计学家安德列 ·马尔可夫最早深入研究了满足马尔可夫假设的过程 ———当前状态只依赖于过去有限的已出现的状态历史. 马尔可夫假设最初是用来解决随机过程问题的. 随着马尔可夫模型的不断完善与成熟 ,近些年来一些人工智能学者把马尔可夫模型引入到识别中 ,并将其发展成为解决识别问题的重要方法 ,其中以隐马尔可夫模型(hidden Markov model , HMM) 为主要模型[37 ] . 隐马尔可夫模型在识别问题上受到了很大的关注 ,在随后的研究中又根据不同的应用领域和情况发展了多种基于隐马尔可夫模型的方法. 其中 ,N. Oliver ,E. Horvitz 和 A. Garg 提出了一种层隐马尔可夫模型[38 ] (layered hidden Markov model ,L H2 HM) ,提出这种表示主要是想通过减少训练和调整需求来分解参数空间 ,L H HM 可以看成是对 HMM 的层叠. 在这个层模型中 ,体系结构每一层都通过它推理出的结果与下一层相连接. 这种表示把问题分割为不同的层 ,这些层可以运行在不同的时序粒度上 ,即允许从在多个特定时刻的逐点观察到不同时序间隔的解释的时序抽象. Kevin Murp hy 提到了一种隐半马尔可夫模型[39 ] ( HSMM) ,它是一种类马尔可夫模型 ,其主要特点是对于每个状态都可以忽略观察的序列. 隐马尔可夫模型主要应用在语音识别、机器视觉(人脸检测 ,机器人足球) 、图像处理(图像去噪、图像识别) 、人机交互系统中的人类行为的自动与半自动识别、生物医学分析 (DNA/ 蛋白质序列分析) 等方面. 隐马尔可夫模型因其研究的透彻性以及算法的成熟性 ,使它在识别领域中具有很高的效率 ,识别效果好 ,同时也易于训练. 但它也存在着一定的问题 ,比如缺乏结构性 ,参数过量 ,在用训练数据进行长而复杂的时序序列推理时 ,易产生数据过拟合(过拟合是指模型不能拟合未来的数据) . 正因为 HMM 具有以上的缺陷才导致复杂贝叶斯网络在识别上的发展和应用. 2113 基于抽象策略的规划识别抽象(abstraction) 在智能体规划其行为的方式上起着非常重要的作用 ,特别是在大的规划领域中降低计算复杂度上 ,抽象显得尤为重要. 有了抽象的规划方法 ,自然容易让人想到抽象在规划识别上的应用. H. H. Bui ,S. Venkatesh 等人提出了一种在有噪音和不确定性领域中识别智能体行为的方法[40 ] ,它可跨越多层抽象 ,即在抽象概率推理中应用抽象马尔可夫策略 ( abstract Markov policies , AMP) 作为智能体行为的模型 ,且在动态贝叶斯网络中应用概率推理 ,从一系列观察中推断出正确的策略. AMP 是马尔可夫决策过程 (MDP) 一个策略的扩展. 原始的 MDP 被模型化为 2 层 :原始动作层和规划层(也就是策略) . 而 AMP 是多层的 ,顶层是最抽象的策略 (记为πK , t 时刻的高层策略记为 πK ( t) ) ,抽象程度依次下降 ,底层为策略层 ,即原始动作层. 当执行上层的抽象策略时会引发下层抽象策略的执行 ,依次向下直到执行到底层策略[41 ] . 给定当前的观察序列 (状态系列) ,相应的策略识别问题可以形式化为计算当前策略的条件概率. 在 t 时刻 , 给定观察序列 , AMP 关心的是在当前状态下所有第 k 层策略的概率 , 这样就知道了从当前动作层 ( k = 0) 到高层策略( k = K) 在所有抽象层上智能体行为的相关信息. 策略识别问题的解决还建立在信度状态 ( belief state ) 和基于状态空间区域分解 (state2space region2based decompo sition ) 的基础上. 执行高层策略πK 的过程可以用一个动态贝叶斯网络 DBN 表示 ,如图 1 ,这一过程可以命名为抽象马尔可夫模型(abstract markov model , AMM) . 当状态是部分可观察时 ,一个观察层可以附属于一个状态层 ,如图 1. 因为状态像 HMM 一样被隐藏 , 所以得到的结果称为抽象隐马尔可夫模型(abstract hidden Markov model) . A HMM 是 HMM 的扩展 , HMM 中的单链由多层隐链代替 , 也可以说 A HMM 是动态概率网络(DPN ,也称动态贝叶斯网络) 的一种特殊形式 ,其中 DPN 是一种特殊的贝叶斯网络 ,可以处理具有时序动态变化的环境[42 ] . A HMM 的基础是多层贝叶斯动态结构 ,连续 2 层之间的连接是较高层较抽象路径向较低层改进路径的分解. 智能体想要实现高层目标时 ,它可以通过层层关系在不同的抽象层创建一系列子目标 ,直到底层状态层 ,以这样的过程来实现这个高层目标. 实际上 A HMM 的识别与 AMP 的识别过程在本质上是没有区别的. 策略识别和 A HMM 都适用在大规模的空间环境 ,这样的环境具有复杂的空间布局、大的状态空间等特点 ,它可以处理不满足马尔可夫假设的问题. 但是策略识别与 A HMM 识别在信度状态上的计算量仍然很大 ,虽然也采取了一些方法降低计算复杂 ·8 · 智能系统学报第 2 卷

<<向上翻页向下翻页>>

点击下载：东北师范大学：【学术论文 - 智能系统】规划识别的研究及其应用（谷文祥、李丽、李丹丹）