当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

西安电子科技大学:《神经网络与模糊系统 Neural Networks and Fuzzy Systems》课程PPT课件讲稿(2006)Chapter 05-1 突触动力学Ⅱ——有监督学习

资源类别:文库,文档格式:PPT,文档页数:12,文件大小:134KB,团购合买
点击下载完整版文档(PPT)

chapter5突触动力学Ⅱ一 有监督学习 学号:0622310213 姓名:余景景

chapter 5 突触动力学Ⅱ—— 有监督学习 学号:0622310213 姓名: 余 景 景

本章内容要点 有监督学习的理论解释 。有监督的函数估计 0 有监督的学习相当于操作性条件反射 。有监督的学习相当于有先验知识的随机模式学习 前馈网络的监督学习算法 感知器 最小均方误差(LMS)算法 反向传播(BP)算法

本章内容要点 ◼ 有监督学习的理论解释  有监督的函数估计  有监督的学习相当于操作性条件反射  有监督的学习相当于有先验知识的随机模式学习 ◼ 前馈网络的监督学习算法  感知器  最小均方误差(LMS)算法  反向传播(BP) 算法

第一部分内容 有监督学习和无监督学习 有监督的函数估计 ·有监督学习相当于操作性条件反射 ·有监督学习相当于有先验知识的随机模式学习

第一部分内容 ◼ 有监督学习和无监督学习 ◼ 有监督的函数估计 ◼ 有监督学习相当于操作性条件反射 ◼ 有监督学习相当于有先验知识的随机模式学习

有监督学习 系列训训练样本 其中每个样本都做上了标 ,比如说标记出这 样本来自对二个苹果的一次 观测。学习的的嘉从这带看标记的样本革学习 到香样 一些概念,比如说行公样的数据对应苹果市不是 蕉,并耳在耒莱给出新的样本时,能够正确预测新 本的际记。 描述环境状态 环境 的信号 教师 期望 响应 十 学习 实际响应 系统 误差信号

有监督学习 ◼ 给定一系列训练样本,其中每个样本都做上了标 记,比如说标记出这个样本来自对一个苹果的一次 观测。学习的目的是从这些带有标记的样本中学习 到一些概念,比如说什么样的数据对应苹果而不是 香蕉,并且在未来给出新的样本时,能够正确预测新 样本的标记。 环境 教师 学习 系统  实际响应 误差信号 期望 响应 描述环境状态 的信号 + -

无监督学习 ■ 给定一系列没有任何标记的训练样本,学 习的目的时发现隐藏在这些样本中的某 种结构,例如样本的聚类情况。 状态向量 环境 学习系统 U

无监督学习 ◼ 给定一系列没有任何标记的训练样本,学 习的目的时发现隐藏在这些样本中的某 种结构,例如样本的聚类情况。 环境 学习系统 状态向量

有监督的丞数估计 给定观察得到的随机矢量样本对: (X1,y),(x2,y2),…(xm,ym) 要估计一个未知函数: f:X→Y X,∈xGR” y,∈yGR 使得期望误差函数EJ最小。 O i 误差=期望输出-实际输出

有监督的函数估计 ◼ 给定观察得到的随机矢量样本对: ◼ 要估计一个未知函数: ◼ ◼ 使得期望误差函数E[J]最小。  误差=期望输出-实际输出 1 1 2 2 ( , ),( , ), ( , ) m m x y x y x y n i p i x x R y y R     f X Y : →

有监督的丞数估计 设N为一个神经网络的传递函数,那么可以定义瞬时误 差为y-N(x)这是一个随机向量,由于我们不知道联 合概率密度函数p(x,y)无法求出ELy,一N(x一般用均 方差 E[y-N(x)横代N(x)I] 随机逼近用观测到的随机量来估计期望值,然后在离散 的近似算法中使用这些估计量。 用的比较多的近似算法是随机梯度下降法。如本章将 要讲述的Vidrow'sLMS算法中所用的就是随机梯度

有监督的函数估计 ◼ 设N为一个神经网络的传递函数,那么可以定义瞬时误 差为 ,这是一个随机向量,由于我们不知道联 合概率密度函数p(x,y)无法求出 ,一般用均 方差 替代。 ◼ 随机逼近用观测到的随机量来估计期望值,然后在离散 的近似算法中使用这些估计量。  用的比较多的近似算法是随机梯度下降法。如本章将 要讲述的Widrow’s LMS算法中所用的就是随机梯度。 ( ) i i y N x − [ ( )] E y N x i i − [( ( ))( ( )) ] T E y N x y N x i i i i − −

有监督学习相当于操作性条件反射 操作性条件反射强化响应,如果输入与期望 的输出不同,就调节权值m。 刺激 反射响应 环境 器官 操作 监督者加强 或忽略响应

有监督学习相当于操作性条件反射 ◼ 操作性条件反射强化响应,如果输入与期望 的输出不同,就调节权值m

无监督学习相当于传统条件反射 传统条件反射强化刺激。这种神经网络直接把输入 x耦合到输出y。 例如,一个生物体学会了一刺激响应对:S→R那么在条件 刺激S中加一个条件B进行学习,得到 (B&S)→R或B→(S→R) 不断强化刺激,直到输入B时反应为R。这样就有B→R 也就是学会了一条规则。如巴普洛夫条件反射试验。 巴普 食物S 流口水R 巴普 流口水R 洛夫 狗 洛夫 狗 拼铃挡B 摇铃铛部

无监督学习相当于传统条件反射 S R → 传统条件反射强化刺激。这种神经网络直接把输入 x耦合到输出y。 例如,一个生物体学会了一刺激响应对: 那么在条件 刺激 S中加一个条件B进行学习,得到 ( & ) ( ) B S R B S R → → → 或 不断强化刺激,直到输入B时反应为R。这样就有: 也就是学会了一条规则。如巴普洛夫条件反射试验。 B R →

有监督学习相当于 有先验知识的随机模式学习 模式:模式空间"上的点 时变模式:定义在R”中的轨迹线 ◆ 随机模式学习 由已知的样本x(1),x(2).xn)来估计x的概 率密度函数p(x) ■ 模式类DD.是R”的子集,也叫决策类 满足: R”=DOD...UD且D∩D,=Φ如果i≠j

有监督学习相当于 有先验知识的随机模式学习 ◼ 模式:模式空间 上的点 ◼ 时变模式:定义在 中的轨迹线 ◼ 随机模式学习  由已知的样本x(1),x(2)…x(n)来估计x的概 率密度函数p(x) ◼ 模式类: 是 的子集,也叫决策类, 满足: n R n R 1 2 n R D D D D D i j =    =   k i j 且 如果 n D D 1 ... k R

点击下载完整版文档(PPT)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共12页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有