正在加载图片...
P(Y=y,X=x)=b1a42…by,a、-、b (10.2) 其中 N为样本观测的时间长度 X=(X1,…XN),Y=(H1,…,Y),y=(y1;…,yx),x=(1,…,) yn∈{1,VM},1≤in≤L,1≤n≤N,初始概率向量(初始分布)为=(μ1…,).由 未知状态链与测量到的观测链一起(X,),就构成了隐 Markov模型,这里“隐”的含义是 说状态链是隐藏起来的 隐 Markov模型的基本假定是: 参数向量μ,参数矩阵A与B=(b1)(i∈{…,},l∈,…vM})都是未知 的,我们将它们合记为参数组λ=(μ,A,B).参数组λ=(μ,A,B)完全确定了状态链与观测连 的联合统计规律,所以,我们通常用一个λ表示一个隐 Markov模型,并称之为隐 Markov模型 λ(更确切地为隐 Markov链).在例 0.12中,3个不同的模型就对应了3个不同的参数组.只要令Xn=Sn,Y=On4,它们 满足HM条件,因而纳入了隐 Markov模型的框架 (10.2)是(X,Y)的联合分布通过参数表达的形式,它是计算各种边缘概率与条件概率的 出发点.而HM条件的含义是:状态链与观测链的联合分布是由一系列简单转移与条件概率的 乘积表达的 2.3隐 Markov模型的等价表述 由例10.12的启示,可以想到下面的等价条件 命题10.14 HM条件等价于:对于任意的i∈(1,…,L}以及l∈{v1,…,vM},有 P(Yn=v|Xn=i,Yn1=ln13Xm1=v,…H1=1,X1=v1)=P(Yn=v2|Xn=1)=bn, P(Xn1=j|Xn=in=Vn,Xn1=in…,X1=1,=v1)=P(xn1=川X,=D)=an 这两个等式的证明只需利用条件概率的定义.所以我们把它留给读者.它们的直观含义就是: n与Xn1相对于历史条件的统计规律只与时间上最接近的Xn有关,而与其它更早的历史无 关.在实际问题中,这是比较容易判断的 2.4非线性滤波作为隐 Markov模型的特例 设Xn是取值于状态空间S={12…,L}的 Markov链,其样本不能被实际测量得到.而 能测量到的是如下的Y的样本 8(Xn) 其中g是一个未知函数,{n}是独立同分布的随机干扰,只取有限个值,且与随机过程 Xn}独立.那么{Xn,Hn}就是一个(二维的)隐 Markov模型.这就把(10.5)的非线 性滤波放进了HM的框架 2.5在应用中研究隐 Markov模型的主要方面 (1)从一段观测序列{k,k≤m}及已知模型λ=(μ,A,B)出发,估计Xn的最佳值, 称为解码问题.这是状态估计问题271 i i y i i iN yN iN iN iN yN P Y y X x b a b a b 1 1 1 1 2 1 1 1 ( , ) - - - = = = m L , (10. 2) 其 中 N 为样本观测的时间长度 , 而 ( , , ) X = X1 L X N , ( , , ) Y = Y1 L YN , ( , , ) 1 N y = y L y , ( , , ) 1 N x = i L i , y n Î{n1 ,Ln M },1 £ i n £ L,1 £ n £ N , 初始概率向量(初始分布)为 ( , , ) m = m1 L mL .由 未知状态链与测量到的观测链一起( , ) Xn Yn , 就构成了隐 Markov 模型 ,这里“隐”的含义是 说状态链是隐藏起来的. 隐 Markov 模型的基本假定是: 参数向量m ,参数矩阵 A 与 il L M B b ´ D =( ) ( {1, , }, { , , } 1 M i Î L L l Î n L n )都是未知 的,我们将它们合记为参数组 l (m, A,B) D = .参数组 l (m, A,B) D = 完全确定了状态链与观测连 的联合统计规律,所以,我们通常用一个l 表示一个隐 Markov 模型,并称之为隐 Markov 模型 l (更确切地为隐 Markov 链). 在例 10.12 中,3个不同的模型就对应了3个不同的参数组.只要令 1 , n = n Yn = On + X S ,它们 满足 HMM 条件,因而纳入了隐 Markov 模型的框架. (10.2)是(X ,Y) 的联合分布通过参数表达的形式, 它是计算各种边缘概率与条件概率的 出发点. 而 HMM 条件的含义是:状态链与观测链的联合分布是由一系列简单转移与条件概率的 乘积表达的. 2.3 隐 Markov 模型的等价表述 由例10.12的启示,可以想到下面的等价条件 命题10.14 HMM 条件等价于: 对于任意的i Î (1,L, L}以及 l Î{n1 ,L,n M },有 ( | , , , , , ) ( | ) , 1 1 1 1 1 1 1 1 n l n n n n l l n l n il P Y v X i Y i X Y i X P Y v X i b n D = = = =n = =n = = = = - - - - L (10. 3) ( | , , , , , ) ( | ) 1 1 1 1 1 1 1 1 P X j X i Y X i X i Y P X j X i n+ = n = n =nln n- = n- L = =nl = n+ = n = ij a D = , (10. 4) 这两个等式的证明只需利用条件概率的定义.所以我们把它留给读者.它们的直观含义就是: Yn 与 Xn+1 相对于历史条件的统计规律只与时间上最接近的 Xn 有关, 而与其它更早的历史无 关.在实际问题中, 这是比较容易判断的. 2.4 非线性滤波作为隐 Markov 模型的特例 设 Xn 是取值于状态空间S = {1,2,L, L} 的 Markov 链,其样本不能被实际测量得到.而 能测量到的是如下的Yn 的样本 n X n wn Y = g( ) + , (10. 5) 其中 g 是一个未知函数,{ } wn 是独立同分布的随机干扰, 只取有限个值, 且与随机过程 { } X n 独立.那么 { , } X n Yn 就是一个(二维的)隐 Markov 模型.这就把(10.5)的非线 性滤波放进了 HMM 的框架. 2. 5 在应用中研究隐 Markov 模型的主要方面 (1) 从一段观测序列{Y , k m} k £ 及已知模型l = (m, A,B) 出发, 估计 X n 的最佳值, 称为解码问题. 这是状态估计问题
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有