当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

《机器学习》课程配套教学电子教案(PPT课件讲稿)第12章 归纳和分析学习的结合

资源类别:文库,文档格式:PPT,文档页数:27,文件大小:161KB,团购合买
本章考虑将归纳和分析的机制结合起来的方法,并获得两者的优点:有先验知识时获得更高的泛化精度和依赖训练数据克服先验知识的不足
点击下载完整版文档(PPT)

机器学习 第12章归纳和分析学习的结合 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏1

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 1 机器学习 第12章 归纳和分析学习的结合

概述 纯粹的归纳学习方法通过在训练样例中寻找经 验化的规律来形成一般假设 纯粹的分析方法使用先验知识演绎推导一般假 设 ·本章考虑将归纳和分析的机制结合起来的方法, 并获得两者的优点:有先验知识时获得更高的 泛化精度和依赖训练数据克服先验知识的不足 所得到的结合的方法比纯粹的归纳方法和分析 方法的性能都要高 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏2

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 2 概述 • 纯粹的归纳学习方法通过在训练样例中寻找经 验化的规律来形成一般假设 • 纯粹的分析方法使用先验知识演绎推导一般假 设 • 本章考虑将归纳和分析的机制结合起来的方法, 并获得两者的优点:有先验知识时获得更高的 泛化精度和依赖训练数据克服先验知识的不足 • 所得到的结合的方法比纯粹的归纳方法和分析 方法的性能都要高

动机 归纳学习寻找拟合训练数据的一般假设,分析学习寻 找拟合先验知识的一般假设,同时使它覆盖训练数据 归纳方法和分析方法对假设的论证方法有根本区别, 因此优缺点互为补充,将它们结合起来有可能得到更 强有力的学习方法 纯粹的分析学习方法的优缺点 优点:可用先验知识从较少的数据中更精确地泛化以引导学 缺点:当先验知识不足或不正确时,可能产生误导 纯粹的归纳学习方法的优缺点 优点:不需要显示的先验知识,主要基于训练数据学习规律 缺点:训练数据不足时,会失败,会被其中隐式的归纳偏置 2031218所祝导习归纳和分析学习的结合作者:Mme译者:曾华军等讲者:陶晓鹏3

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 3 动机 • 归纳学习寻找拟合训练数据的一般假设,分析学习寻 找拟合先验知识的一般假设,同时使它覆盖训练数据 • 归纳方法和分析方法对假设的论证方法有根本区别, 因此优缺点互为补充,将它们结合起来有可能得到更 强有力的学习方法 • 纯粹的分析学习方法的优缺点 – 优点:可用先验知识从较少的数据中更精确地泛化以引导学 习 – 缺点:当先验知识不足或不正确时,可能产生误导 • 纯粹的归纳学习方法的优缺点 – 优点:不需要显示的先验知识,主要基于训练数据学习规律 – 缺点:训练数据不足时,会失败,会被其中隐式的归纳偏置 所误导

表12-纯粹的分析学习和纯粹 的归纳学习的比较 归纳学习 分析学习 目标拟合数据的假设拟合领域理论的 假设 论证统计推理 演绎推理 优点需要很少先验知识|从稀少的数据中 学习 缺陷|稀少的数据,不正|不完美的领域理 确的偏置 论 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏4

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 4 表12-1 纯粹的分析学习和纯粹 的归纳学习的比较 归纳学习 分析学习 目标 拟合数据的假设 拟合领域理论的 假设 论证 统计推理 演绎推理 优点 需要很少先验知识 从稀少的数据中 学习 缺陷 稀少的数据,不正 确的偏置 不完美的领域理 论

动机(2) 图12-1 概述了学习问题的分布范围,它随着可获得的先验 知识和训练数据不同而变化 在一个极端,有大量的训练数据,但没有先验知识 在另一个极端,有很强的先验知识,但训练数据很 少 多数实际学习问题位于这两个极端之间,通常可以 从近似的先验知识开始 本章考虑的问题是: 什么样的算法,使用近似的先验知识结合可用数据 来形成一般的假设 203.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏5

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 5 动机(2) • 图12-1 – 概述了学习问题的分布范围,它随着可获得的先验 知识和训练数据不同而变化 – 在一个极端,有大量的训练数据,但没有先验知识 – 在另一个极端,有很强的先验知识,但训练数据很 少 – 多数实际学习问题位于这两个极端之间,通常可以 从近似的先验知识开始 • 本章考虑的问题是: – 什么样的算法,使用近似的先验知识结合可用数据 来形成一般的假设

动机(3) 即使使用最纯粹的归纳学习算法,仍有机会基于特定学习仼务的 先验知识来选择设计方案 通常设计者将领域特定的知识嵌入到学习算法中,但我们感兴趣 的是一个系统能将先验知识和训练数据作为显示的输入给学习器 概括而言,我们感兴趣的是领域无关算法,这种算法使用显示输 入的领域相关的知识,这种算法具备以下的属性: 如果没有领域理论,它至少能像纯粹的归纳方法一样有效学习 如果没有完美的领域理论,它至少能像纯粹的分析方法一样有效学 如果领域理论和训练数据都不完美,它应能结合两者的长处,比单 纯的归纳或分析方法的性能要好 它应能处理训练数据中未知程度的差错 它应能处理领域理论中未知程度的差错 这里列出的期望目标很难达到,目前没有算法能以一般化的方式 2003 足所舊塏象肅柱 析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏6

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 6 动机(3) • 即使使用最纯粹的归纳学习算法,仍有机会基于特定学习任务的 先验知识来选择设计方案 • 通常设计者将领域特定的知识嵌入到学习算法中,但我们感兴趣 的是一个系统能将先验知识和训练数据作为显示的输入给学习器 • 概括而言,我们感兴趣的是领域无关算法,这种算法使用显示输 入的领域相关的知识,这种算法具备以下的属性: – 如果没有领域理论,它至少能像纯粹的归纳方法一样有效学习 – 如果没有完美的领域理论,它至少能像纯粹的分析方法一样有效学 习 – 如果领域理论和训练数据都不完美,它应能结合两者的长处,比单 纯的归纳或分析方法的性能要好 – 它应能处理训练数据中未知程度的差错 – 它应能处理领域理论中未知程度的差错 • 这里列出的期望目标很难达到,目前没有算法能以一般化的方式 满足所有这些约束

学习的归纳-分析途径 本章考虑的学习问题 已知 一个训练样例集合D,可能包含差错 一个领域理论B,可能包含差错 ·候选假设的空间H 求解 个最好地拟合训练样例和领域理论的假设 最好地拟合训练样例和领域理论的确切 定义 rg min kperrorp(h)+kgerrorB(h) 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏7

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 7 学习的归纳-分析途径 • 本章考虑的学习问题 – 已知 • 一个训练样例集合D,可能包含差错 • 一个领域理论B,可能包含差错 • 候选假设的空间H – 求解 • 一个最好地拟合训练样例和领域理论的假设 • 最好地拟合训练样例和领域理论的确切 定义 argmin k error (h) k error (h) D D B B h H + 

学习的归纳-分析途径(2) 确定先验知识和数据权值的一种解决方法是使用贝叶 斯观点 贝叶斯定律描述了怎样计算给定训练数据D时假设h的后验概率 贝叶斯定律基于观察到的数据D以及先验知识计算后验概率,以P(h) P(D)和PDh)的形式表示 我们可以把P(h),P(D)和P(Dh)看作是某种形式的背景知识 贝叶斯理论可看作一种为领域理论加权的方法,它与观察到的数据D 一起,赋予h的后验概率为P(hD) 贝叶斯公式提供了为先验知识和观察到数据的贡献加权的方法 但是,贝叶斯公式隐含假定了关于P(h,P①D),P(Dh 率分布的完美知识 贝叶斯公式没有提供将这些近似已知的概率分布与观 察数据结合起来的方法 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏8

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 8 学习的归纳-分析途径(2) • 确定先验知识和数据权值的一种解决方法是使用贝叶 斯观点 – 贝叶斯定律描述了怎样计算给定训练数据D时假设h的后验概率 – 贝叶斯定律基于观察到的数据D以及先验知识计算后验概率,以P(h), P(D)和P(D|h)的形式表示 – 我们可以把P(h), P(D)和P(D|h)看作是某种形式的背景知识 – 贝叶斯理论可看作一种为领域理论加权的方法,它与观察到的数据D 一起,赋予h的后验概率为P(h|D) – 贝叶斯公式提供了为先验知识和观察到数据的贡献加权的方法 • 但是,贝叶斯公式隐含假定了关于P(h), P(D), P(D|h)概 率分布的完美知识 • 贝叶斯公式没有提供将这些近似已知的概率分布与观 察数据结合起来的方法

假设空间搜索 大多数学习任务可以刻画为假设空间上的搜索 任务而决定这个搜索任务的4个参数是: 假设空间H 搜索的初始假设h0 定义单个搜索步的搜索算子集合O 指定搜索目标的判据G 本章探索了3种方法,它们用先验知识来改变 纯归纳方法执行的搜索 使用先验知识推导出搜索起步的初始假设: Kbann 使用先验知识来改变假设空间搜索的目标:Ebn 2031218使先验识銮县用的摁蠹,Ql讲者;购晓鹏

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 9 假设空间搜索 • 大多数学习任务可以刻画为假设空间上的搜索 任务,而决定这个搜索任务的4个参数是: – 假设空间H – 搜索的初始假设h0 – 定义单个搜索步的搜索算子集合O – 指定搜索目标的判据G • 本章探索了3种方法,它们用先验知识来改变 纯归纳方法执行的搜索 – 使用先验知识推导出搜索起步的初始假设:Kbann – 使用先验知识来改变假设空间搜索的目标:Ebnn – 使用先验知识改变可用的搜索步:Focl

使用先验知识得到的初始假设 KBANN技术:一种使用先验知识的方法是将假设初始 化为完美拟合领域理论,然后按照需要归纳地精化初 始假设以拟合训练数据 这种技术的动机是:如果领域理论是正确的,初始假 设将正确分类所有训练样例,而无需再修正;如果初 始假设不能完美地分类训练样例,那么它需要被归纳 精华,以改进它在训练样例上的拟合度 在纯粹归纳的反向传播算法中,权值一般被初始化为 小的随机值,KBAN的含义是:即使领域理论是近似 正确的,将网络初始化为拟合领域理论,比初始化为 随机值有更好的近似开端 2003.12.18机器学习-归纳和分析学习的结合作者: Mitchel译者:曾华军等讲者:陶晓鹏10

2003.12.18 机器学习-归纳和分析学习的结合作者:Mitchell 译者:曾华军等讲者:陶晓鹏 10 使用先验知识得到的初始假设 • KBANN技术:一种使用先验知识的方法是将假设初始 化为完美拟合领域理论,然后按照需要归纳地精化初 始假设以拟合训练数据 • 这种技术的动机是:如果领域理论是正确的,初始假 设将正确分类所有训练样例,而无需再修正;如果初 始假设不能完美地分类训练样例,那么它需要被归纳 精华,以改进它在训练样例上的拟合度 • 在纯粹归纳的反向传播算法中,权值一般被初始化为 小的随机值,KBANN的含义是:即使领域理论是近似 正确的,将网络初始化为拟合领域理论,比初始化为 随机值有更好的近似开端

点击下载完整版文档(PPT)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共27页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有