chapter5突触动力学Ⅱ一 有监督学习 学号:0622310213 姓名:余景景
chapter 5 突触动力学Ⅱ—— 有监督学习 学号:0622310213 姓名: 余 景 景
本章内容要点 有监督学习的理论解释 。有监督的函数估计 0 有监督的学习相当于操作性条件反射 。有监督的学习相当于有先验知识的随机模式学习 前馈网络的监督学习算法 感知器 最小均方误差(LMS)算法 反向传播(BP)算法
本章内容要点 ◼ 有监督学习的理论解释 有监督的函数估计 有监督的学习相当于操作性条件反射 有监督的学习相当于有先验知识的随机模式学习 ◼ 前馈网络的监督学习算法 感知器 最小均方误差(LMS)算法 反向传播(BP) 算法
第一部分内容 有监督学习和无监督学习 有监督的函数估计 ·有监督学习相当于操作性条件反射 ·有监督学习相当于有先验知识的随机模式学习
第一部分内容 ◼ 有监督学习和无监督学习 ◼ 有监督的函数估计 ◼ 有监督学习相当于操作性条件反射 ◼ 有监督学习相当于有先验知识的随机模式学习
有监督学习 系列训训练样本 其中每个样本都做上了标 ,比如说标记出这 样本来自对二个苹果的一次 观测。学习的的嘉从这带看标记的样本革学习 到香样 一些概念,比如说行公样的数据对应苹果市不是 蕉,并耳在耒莱给出新的样本时,能够正确预测新 本的际记。 描述环境状态 环境 的信号 教师 期望 响应 十 学习 实际响应 系统 误差信号
有监督学习 ◼ 给定一系列训练样本,其中每个样本都做上了标 记,比如说标记出这个样本来自对一个苹果的一次 观测。学习的目的是从这些带有标记的样本中学习 到一些概念,比如说什么样的数据对应苹果而不是 香蕉,并且在未来给出新的样本时,能够正确预测新 样本的标记。 环境 教师 学习 系统 实际响应 误差信号 期望 响应 描述环境状态 的信号 + -
无监督学习 ■ 给定一系列没有任何标记的训练样本,学 习的目的时发现隐藏在这些样本中的某 种结构,例如样本的聚类情况。 状态向量 环境 学习系统 U
无监督学习 ◼ 给定一系列没有任何标记的训练样本,学 习的目的时发现隐藏在这些样本中的某 种结构,例如样本的聚类情况。 环境 学习系统 状态向量
有监督的丞数估计 给定观察得到的随机矢量样本对: (X1,y),(x2,y2),…(xm,ym) 要估计一个未知函数: f:X→Y X,∈xGR” y,∈yGR 使得期望误差函数EJ最小。 O i 误差=期望输出-实际输出
有监督的函数估计 ◼ 给定观察得到的随机矢量样本对: ◼ 要估计一个未知函数: ◼ ◼ 使得期望误差函数E[J]最小。 误差=期望输出-实际输出 1 1 2 2 ( , ),( , ), ( , ) m m x y x y x y n i p i x x R y y R f X Y : →
有监督的丞数估计 设N为一个神经网络的传递函数,那么可以定义瞬时误 差为y-N(x)这是一个随机向量,由于我们不知道联 合概率密度函数p(x,y)无法求出ELy,一N(x一般用均 方差 E[y-N(x)横代N(x)I] 随机逼近用观测到的随机量来估计期望值,然后在离散 的近似算法中使用这些估计量。 用的比较多的近似算法是随机梯度下降法。如本章将 要讲述的Vidrow'sLMS算法中所用的就是随机梯度
有监督的函数估计 ◼ 设N为一个神经网络的传递函数,那么可以定义瞬时误 差为 ,这是一个随机向量,由于我们不知道联 合概率密度函数p(x,y)无法求出 ,一般用均 方差 替代。 ◼ 随机逼近用观测到的随机量来估计期望值,然后在离散 的近似算法中使用这些估计量。 用的比较多的近似算法是随机梯度下降法。如本章将 要讲述的Widrow’s LMS算法中所用的就是随机梯度。 ( ) i i y N x − [ ( )] E y N x i i − [( ( ))( ( )) ] T E y N x y N x i i i i − −
有监督学习相当于操作性条件反射 操作性条件反射强化响应,如果输入与期望 的输出不同,就调节权值m。 刺激 反射响应 环境 器官 操作 监督者加强 或忽略响应
有监督学习相当于操作性条件反射 ◼ 操作性条件反射强化响应,如果输入与期望 的输出不同,就调节权值m
无监督学习相当于传统条件反射 传统条件反射强化刺激。这种神经网络直接把输入 x耦合到输出y。 例如,一个生物体学会了一刺激响应对:S→R那么在条件 刺激S中加一个条件B进行学习,得到 (B&S)→R或B→(S→R) 不断强化刺激,直到输入B时反应为R。这样就有B→R 也就是学会了一条规则。如巴普洛夫条件反射试验。 巴普 食物S 流口水R 巴普 流口水R 洛夫 狗 洛夫 狗 拼铃挡B 摇铃铛部
无监督学习相当于传统条件反射 S R → 传统条件反射强化刺激。这种神经网络直接把输入 x耦合到输出y。 例如,一个生物体学会了一刺激响应对: 那么在条件 刺激 S中加一个条件B进行学习,得到 ( & ) ( ) B S R B S R → → → 或 不断强化刺激,直到输入B时反应为R。这样就有: 也就是学会了一条规则。如巴普洛夫条件反射试验。 B R →
有监督学习相当于 有先验知识的随机模式学习 模式:模式空间"上的点 时变模式:定义在R”中的轨迹线 ◆ 随机模式学习 由已知的样本x(1),x(2).xn)来估计x的概 率密度函数p(x) ■ 模式类DD.是R”的子集,也叫决策类 满足: R”=DOD...UD且D∩D,=Φ如果i≠j
有监督学习相当于 有先验知识的随机模式学习 ◼ 模式:模式空间 上的点 ◼ 时变模式:定义在 中的轨迹线 ◼ 随机模式学习 由已知的样本x(1),x(2)…x(n)来估计x的概 率密度函数p(x) ◼ 模式类: 是 的子集,也叫决策类, 满足: n R n R 1 2 n R D D D D D i j = = k i j 且 如果 n D D 1 ... k R