北京大学：《模式识别》课程教学资源（课件讲稿）人工神经网络简介

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：362.77KB

19 8.3.1感知器 8.3.1感知器口Perceptron:单层网络，通过监督学习建立模式口感知器目标输出的编码方法识别能力 ■一个输出单元对应一个类别。即，如果输入训练样本的类别标号是，则对应的目标输出编码为：第1个输出节，点为1，其余节点均为0 口单个神经元可实现两类别的线性分类，多个神经元则可以实现多类别的线性分类。如图中的网络就可实现四类 -hard通IWug+b) 问题的分类：训练时，第1类 ☒ 的训练样本理想输出为 R-nmber ot elements n input (10,0,0),第2类的理想输出为 -hardlim IWop+b) (0,1,0,0),第3类为(0,0,1,0) 第4类为(00,0,1). 8.3.1感知器 8.3.2多层感知器口感知器学习算法口多层感知器(Multi-.Layer Perceptron,MLP)结构 △w=n(1k-ak)P Input Hidden Layer Output Layer AW =nep'; LW: a-Ep ■对应于线性判别函 34 数； b: ■对线性可分问题， 3x1 算法收敛，对线性 a:tansig (+bi a:=purelin (LW2a +b2) 不可分的数据，算法不收敛。 2布 8.3.2多层感知器 8.3.2多层感知器口多层感知器的一致逼近性口XOR问题 ■单个闲值神经元可以实现任意多输入的与、或及 ■问题的提出及其重要性与非、或非逻辑门；口1956-1958年Rosenblatt提出感知器，是为了实现 ■任何逻辑函数可由两层前馈网络实现；另一种形式（模拟）的计算机。与数字计算机形 ■当神经元的输出函数为Sigmoid等函数时，两层成鲜明对照。前馈网络可以逼近任意的多元非线性函数口数字计算机是用逻辑门电路实现的。XOR是通用 [Funahashi(1989),Hornik(1989),Stinchcombe& 门(universal logic gate)任何一个逻辑电路都可 White(1989),Hecht(1989)]; 以只用XOR门来实现. ■只要增加网络隐单元个数，就能提高逼近精度。口感知器不能解决XOR问题，因此，复杂的网络可以实现训练数据集上的零错双层感知器可以解决XOR问题误率分类器

31 8.3.3 反向传播 (BP) 算法  隐层的权值修正：局部梯度（误差）的反向传播 ( 1) ' ( 1) ' ( 1) ( ), ( ( )) ; SSE j j k SSE i j i i jj i ji j i k j j k i ji j i J n J n a n an wfn wfn                           w a a   wji i nj aj ni δj wji δi 后层的全部单元都受nj 的影响 32 8.3.3 反向传播 (BP) 算法  算法步骤 1. 初始值选择 W(0)； 2. 前向计算，求出所有神经元的输出 3. 对输出层计算δ： 4. 从后向前计算各隐层δ： 5. 计算并保存各权值修正量： 6. 修正权值： 7. 判断是否收敛，如收敛则结束，否则转至Step 2。 ( ); j a t ( ) (1 ); j j jj j    t aa a (1 ) ; j j j ji i i    aaw   ;   w a ij j i   ( 1) ( ) ; wt wt w ij ij ij    33 8.3.3 反向传播 (BP) 算法  设计讨论  两层感知器可以逼近任意的多元非线性函数；  输入层单元数=输入变量 or 特征维数；  输出层单元数=模式类数 or 待逼近的函数个数；  隐层单元数：无有效选择方法  网络初始化对结果有影响，常用较小的随机数；  学习率η的选择: 可在 (0.1, 3) 试探；  增加惯性项的 BP 算法： ( ) ( 1).      wt a wt ij j i ij    34 8.3.3 反向传播 (BP) 算法  讨论：MLPs 的过拟合现象  增加隐单元个数训练数据分类正确率提高。  训练数据分类正确率提高测试数据正确率提高。  识别正确率与隐单元个数有很大关系！ 35 8.3.3 反向传播 (BP) 算法  多层感知器和 Bayes 决策的关系  对于两类问题 {0,1}，采用均方误差训练，且神经元输出函数为 Sigmoid 函数时，多层感知器的输出是对 Bayes 后验概率的最小均方误差估计。 1 2 2 2 1 2 1 2 2 2 1 1 2 2 2 1 1 [ ( , ) 1] [ ( , )] 1 [ ( , ) ( )] ( ) [ ( , ) 1] ( | ) ( ) [ ( , )] ( | ) ; ( ) K K K s N N f f NN NN f d N Pf pd Pf pd E                             x x x xw xw xw x xw x x xw x x w 大数定理， N∞ 36 8.3.3 反向传播 (BP) 算法  多层感知器和 Bayes 决策的关系 2 1 1 1 2 1 1 ( ) [ ( , ) ( | )] ( ) ( | )(1 ( | )) ( ) ( ) ( | )(1 ( | )) ( ) s E f p pd p p pd e p p pd             w xw x x x x x x x w x x xx 2 argm in ( ) argm in ( ) E e a w w  2 2 1 2 ( ) [ ( , ) ( | )] ( ) argm in ( ) argm in , ( ). s e fp E d e  p     w xw x x x  w w 1 1 1 11 2 2 () ( | ) (| ) , ( ) ( ) ( ) ( | ) ( ) ( | ); p p p P p Pp P p          x x x xx x  且与w无关均方逼近误差

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录