机器学习 第4章人工神经网络(ANN) 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 1 机器学习 第4章 人工神经网络(ANN)
概述 人工神经网络提供了一种普遍且实用的方法从 样例中学习值为实数、离散值或向量的函数 反向传播算法,使用梯度下降来调节网络参数 以最佳拟合由输入-输出对组成的训练集合 人工神经网络对于训练数据中的错误健壮性很 好 ·人工神经网络已被成功应用到很多领域,例如 视觉场景分析,语音识别,机器人控制 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏 2
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 2 概述 • 人工神经网络提供了一种普遍且实用的方法从 样例中学习值为实数、离散值或向量的函数 • 反向传播算法,使用梯度下降来调节网络参数 以最佳拟合由输入-输出对组成的训练集合 • 人工神经网络对于训练数据中的错误健壮性很 好 • 人工神经网络已被成功应用到很多领域,例如 视觉场景分析,语音识别,机器人控制
简介 神经网络学习对于逼近实数值、离散值或向量 值的目标函数提供了一种健壮性很强的方法 对于某些类型的问题,如学习解释复杂的现实 世界中的传感器数据,人工神经网络是目前知 道的最有效的学习方法 反向传播算法 成功例子,学习识别手写字符,学习识别口语, 学习识别人脸 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 3 简介 • 神经网络学习对于逼近实数值、离散值或向量 值的目标函数提供了一种健壮性很强的方法 • 对于某些类型的问题,如学习解释复杂的现实 世界中的传感器数据,人工神经网络是目前知 道的最有效的学习方法 • 反向传播算法 • 成功例子,学习识别手写字符,学习识别口语, 学习识别人脸
生物学动机 ANN受到生物学的启发,生物的学习系统是由相互连接的神经元 组成的异常复杂的网络 ANN由一系列简单的单元相互密集连接构成的,其中每一个单元 有一定数量的实值输入,并产生单一的实数值输出 人脑的构成,大约有101个神经元,平均每一个与其他104个相连 神经元的活性通常被通向其他神经元的连接激活或抑制 最快的神经元转换时间比计算机慢很多,然而人脑能够以惊人的 速度做出复杂度惊人的决策 很多人推测,生物神经系统的信息处理能力一定得益于对分布在 大量神经元上的信息表示的高度并行处理 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 4 生物学动机 • ANN受到生物学的启发,生物的学习系统是由相互连接的神经元 组成的异常复杂的网络。 • ANN由一系列简单的单元相互密集连接构成的,其中每一个单元 有一定数量的实值输入,并产生单一的实数值输出 • 人脑的构成,大约有1011个神经元,平均每一个与其他104个相连 • 神经元的活性通常被通向其他神经元的连接激活或抑制 • 最快的神经元转换时间比计算机慢很多,然而人脑能够以惊人的 速度做出复杂度惊人的决策 • 很多人推测,生物神经系统的信息处理能力一定得益于对分布在 大量神经元上的信息表示的高度并行处理
生物学动机(2) ANN系统的一个动机就是获得这种基于分布表 示的高度并行算法 ANN并未模拟生物神经系统中的很多复杂特征 ANN的研究分为两个团体 使用ANN研究和模拟生物学习过程 获得髙效的机器学习算法,不管这种算法是否反映 了生物过程 本书属于后一个研究团体 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 5 生物学动机(2) • ANN系统的一个动机就是获得这种基于分布表 示的高度并行算法 • ANN并未模拟生物神经系统中的很多复杂特征 • ANN的研究分为两个团体 – 使用ANN研究和模拟生物学习过程 – 获得高效的机器学习算法,不管这种算法是否反映 了生物过程 • 本书属于后一个研究团体
神经网络表示 ALVINN系统 Pomerleau 1993 使用一个学习到的ANN以正常的速度在高速公路上驾驶汽车 ANN的输入是一个30X32像素的网格,输出是车辆行进的方向 每个节点对应一个网络单元的输出,而从下方进入节点的实 线为其输入 隐藏单元,输出仅在网络内部,不是整个网络输出的一部分 每个输出单元对应一个特定的驾驶方向,这些单元的输出决 定哪一个方向是被最强烈推荐的 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 6 神经网络表示 • ALVINN系统 – Pomerleau 1993 – 使用一个学习到的ANN以正常的速度在高速公路上驾驶汽车 – ANN的输入是一个30x32像素的网格,输出是车辆行进的方向 – 每个节点对应一个网络单元的输出,而从下方进入节点的实 线为其输入 – 隐藏单元,输出仅在网络内部,不是整个网络输出的一部分 – 每个输出单元对应一个特定的驾驶方向,这些单元的输出决 定哪一个方向是被最强烈推荐的
神经网络表示(2) ALVINN是很多ANN的典型结构,所有单元分 层互连形成一个有向无环图 通常,ANN图结构可以有很多种类型 无环或有环 有向或无向 本章讨论以反向传播算法为基础的ANN方法 反向传播算法假定网络是一个固定结构,对应 个有向图,可能包含环 ANN学习就是为图中每一条边选取权值 大多数实际应用与 ALVINN相似 2003.12.18 机器学习-人工神经网络作者: Mitchell译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 7 神经网络表示(2) • ALVINN是很多ANN的典型结构,所有单元分 层互连形成一个有向无环图 • 通常,ANN图结构可以有很多种类型 – 无环或有环 – 有向或无向 • 本章讨论以反向传播算法为基础的ANN方法 • 反向传播算法假定网络是一个固定结构,对应 一个有向图,可能包含环 • ANN学习就是为图中每一条边选取权值 • 大多数实际应用与ALVINN相似
适合神经网络学习的问题 训练集合为含有噪声的复杂传感器数据, 例如来自摄像机和麦克风 需要较多符号表示的问题,例如决策树 学习的任务,能够取得和决策树学习大 体相当的结果 反向传播算法是最常用的ANN学习技术 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 8 适合神经网络学习的问题 • 训练集合为含有噪声的复杂传感器数据, 例如来自摄像机和麦克风 • 需要较多符号表示的问题,例如决策树 学习的任务,能够取得和决策树学习大 体相当的结果 • 反向传播算法是最常用的ANN学习技术
反向传播算法适合问题的特征 ·实例是用很多“属性-值”对表示的 目标函数的输出可能是离散值、实数值或者由 若干实数属性或离散属性组成的向量 训练数据可能包含错误 可容忍长时间的训练 可能需要快速求出目标函数值 人类能否理解学到的目标函数是不重要的 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 9 反向传播算法适合问题的特征 • 实例是用很多“属性-值”对表示的 • 目标函数的输出可能是离散值、实数值或者由 若干实数属性或离散属性组成的向量 • 训练数据可能包含错误 • 可容忍长时间的训练 • 可能需要快速求出目标函数值 • 人类能否理解学到的目标函数是不重要的
本章余后部分提纲 讨论训练单个单元的学习算法 介绍组成神经网络的几种主要单元 感知器( perceptron) 线性单元( liner unit) sigmoid单元( sigmoid unit) 给出训练多层网络的反向传播算法 考虑几个一般性问题 ANN的表征能力 假设空间搜索的本质特征 过度拟合问题 反向传播算法的变体 例子,利用反向传播算法训练识别人脸的ANN 2003.12.18机器学习-人工神经网络作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-人工神经网络作者:Mitchell 译者:曾华军等讲者:陶晓鹏 10 本章余后部分提纲 • 讨论训练单个单元的学习算法 • 介绍组成神经网络的几种主要单元 – 感知器(perceptron) – 线性单元(liner unit) – sigmoid单元(sigmoid unit) • 给出训练多层网络的反向传播算法 • 考虑几个一般性问题 – ANN的表征能力 – 假设空间搜索的本质特征 – 过度拟合问题 – 反向传播算法的变体 • 例子,利用反向传播算法训练识别人脸的ANN