《机器学习》课程配套教学电子教案（PPT课件讲稿）第10章学习规则集合

团购合买资源类别：文库，文档格式：PPT，文档页数：53，文件大小：258.5KB

机器学习第10章学习规则集合 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 1 机器学习第10章学习规则集合

概述对学习到的假设,最具有表征力的和最能为人类所理解的表示方法之一是i-then规则的集合本章探索若干能学习这样的规则集合的算法其中,最重要的是学习包含变量的规则集合, 或称一阶Homn子句集合由于一阶Homn子句集合可被解释为逻辑编程语言 Prolog中的程序,学习的过程常被称为归纳逻辑编程本章考察了多种学习规则集合的途径,其中种是基于机器定理证明器中演绎算子的逆转 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏 2

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 2 概述 • 对学习到的假设，最具有表征力的和最能为人类所理解的表示方法之一是if-then规则的集合 • 本章探索若干能学习这样的规则集合的算法 • 其中，最重要的是学习包含变量的规则集合，或称一阶Horn子句集合 • 由于一阶Horn子句集合可被解释为逻辑编程语言Prolog中的程序，学习的过程常被称为归纳逻辑编程 • 本章考察了多种学习规则集合的途径，其中一种是基于机器定理证明器中演绎算子的逆转

简介在许多情况下,有必要学习一个由若干 if-then 规则共同定义的目标函数,比如决策树遗传算法本章我们讨论一组不同的算法,它们直接学习规则集合,与前面算法有两点关键的不同可学习包含变量的一阶规则集合(一阶子句的表达能力比命题规则要强得多) 使用序列覆盖算法,一次学习一个规则,以递增的方式形成最终的规则集合 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 3 简介 • 在许多情况下，有必要学习一个由若干if-then 规则共同定义的目标函数，比如 – 决策树 – 遗传算法 • 本章我们讨论一组不同的算法，它们直接学习规则集合，与前面算法有两点关键的不同 – 可学习包含变量的一阶规则集合（一阶子句的表达能力比命题规则要强得多） – 使用序列覆盖算法，一次学习一个规则，以递增的方式形成最终的规则集合

简介(2) 阶规则集合的例子 if Parent(x,y) then Ancestor(x, y) if Parent(x, z)A Ancestor(z, y) then Ancestor(x, y) 这个规则集合很紧凑地描述了一个递归函数,它很难用决策树或其他命题的方法来表示 Prolog程序就是一阶规则的集合,因此一个可以学习这种规则集合的通用算法,可被看作是从样例中自动推导出 Prolog程序的算法阶表示的学习系统在实践中的应用在质谱仪中学习哪一个化学药品能粘合碎片学习哪一个化学亚结构会产生诱导有机体突变的放射性物质学习有限单元网以分析物理结构中的应力 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 4 简介（2） • 一阶规则集合的例子 if Parent(x,y) then Ancestor(x,y) if Parent(x,z)  Ancestor(z,y) then Ancestor(x,y) – 这个规则集合很紧凑地描述了一个递归函数，它很难用决策树或其他命题的方法来表示 • Prolog程序就是一阶规则的集合，因此一个可以学习这种规则集合的通用算法，可被看作是从样例中自动推导出Prolog程序的算法 • 一阶表示的学习系统在实践中的应用 – 在质谱仪中学习哪一个化学药品能粘合碎片 – 学习哪一个化学亚结构会产生诱导有机体突变的放射性物质 – 学习有限单元网以分析物理结构中的应力

内容安排先介绍能够学习命题规则集的算法(命题规则可看作不含变量的一阶规则) 算法搜寻假设空间学习析取规则集合将上面算法扩展到一阶规则讨论归纳逻辑的两种通用途径以及归纳和演绎推理的基本关系 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 5 内容安排 • 先介绍能够学习命题规则集的算法（命题规则可看作不含变量的一阶规则），算法搜寻假设空间学习析取规则集合 • 将上面算法扩展到一阶规则 • 讨论归纳逻辑的两种通用途径以及归纳和演绎推理的基本关系

序列覆盖算法 ·序列覆盖算法学习一个规则,移去它覆盖的数据,再重复这一过程假定已有一个子程序 Learn-One-Rule,它的输入是一组正例和反例,输出是单个规则,它能够覆盖许多正例而覆盖很少的反例我们要求输出的规则有较高的精确度,但不必有较高的覆盖度 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 6 序列覆盖算法 • 序列覆盖算法 – 学习一个规则，移去它覆盖的数据，再重复这一过程 • 假定已有一个子程序Learn-One-Rule，它的输入是一组正例和反例，输出是单个规则，它能够覆盖许多正例而覆盖很少的反例 • 我们要求输出的规则有较高的精确度，但不必有较高的覆盖度

序列覆盖算法(2) 序列覆盖算法的过程在所有可用训练样例上执行Lean-One-Rule 再移去由其学到的规则覆盖的正例重复上面的过程,直到规则集覆盖正例达到希望的程度序列覆盖算法按次序学习到一组规则,它们共同覆盖了全部正例规则集中的规则可排序,分类新实例时可先应用精度最高的规则 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 7 序列覆盖算法（2） • 序列覆盖算法的过程 – 在所有可用训练样例上执行Learn-One-Rule – 再移去由其学到的规则覆盖的正例 – 重复上面的过程，直到规则集覆盖正例达到希望的程度 • 序列覆盖算法按次序学习到一组规则，它们共同覆盖了全部正例 • 规则集中的规则可排序，分类新实例时可先应用精度最高的规则

表10-1学习析取规则集的序列覆盖算法(CN2) Sequential-Covering(Target attribute, Attributes, Examples Threshold) Learned rulest RuletLearn-One-Rule Target attribute, Attributes Examples Performance(Rule, Examples)>Threshold Learned rules< Learned rules+ rule Examples∈ Examples-{被Rule正确分类的样例} Rulet-Learn-One- Rule(Target attribute, Attributes, Examples) Learned rules∈按照在 Examples上的 Performance排序的 earned rules 返回 Learned rules 2003.12.18机器学习-学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 8 表10-1 学习析取规则集的序列覆盖算法（CN2） Sequential-Covering(Target_attribute, Attributes, Examples, Threshold) • Learned_rules{} • RuleLearn-One-Rule(Target_attribute, Attributes, Examples) • 当Performance(Rule, Examples)>Threshold – Learned_rulesLearned_rules+Rule – ExamplesExamples-{被Rule正确分类的样例} – RuleLearn-One-Rule(Target_attribute, Attributes, Examples) • Learned_rules按照在Examples上的Performance排序的 Learned_rules • 返回Learned_rules

序列覆盖算法(3) 序列覆盖算法将问题化简为一系列简单的问题,执行的是一种贪婪搜索,它不能保证找到能覆盖样例的最小或最佳规则集下面重点讨论 Learn- One-Rule的设计,我们希望算法能够得到较高精度的规则集, 但不必覆盖所有的正例 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 9 序列覆盖算法（3） • 序列覆盖算法将问题化简为一系列简单的问题，执行的是一种贪婪搜索，它不能保证找到能覆盖样例的最小或最佳规则集 • 下面重点讨论Learn-One-Rule的设计，我们希望算法能够得到较高精度的规则集，但不必覆盖所有的正例

般到特殊的柱状搜索种方法是,将假设空间搜索过程设计为与ID3算法中相似的方式,但在每一步只沿着最有希望的分支进行, 即产生最佳性能的属性-值对,而不是用增长子树的办法覆盖所选属性的所有可能值 ·与ID3类似,可定义最佳分支,它覆盖的样例有最低的熵与其他贪婪算法一样,上面算法的缺陷是,它的每步都可能做出次优的选择用柱状搜索来减小风险,即每一步保留k个最佳候选分支,每一步对k个候选分支进行处理,然后再将结果集削减至k个最可能成员 2003.12.18机器学习学习规则集合作者: Mitchell译者:曾华军等讲者:陶晓鹏

2003.12.18 机器学习-学习规则集合作者：Mitchell 译者：曾华军等讲者：陶晓鹏 10 一般到特殊的柱状搜索 • 一种方法是，将假设空间搜索过程设计为与ID3算法中相似的方式，但在每一步只沿着最有希望的分支进行，即产生最佳性能的属性-值对，而不是用增长子树的办法覆盖所选属性的所有可能值 • 与ID3类似，可定义最佳分支，它覆盖的样例有最低的熵 • 与其他贪婪算法一样，上面算法的缺陷是，它的每一步都可能做出次优的选择 • 用柱状搜索来减小风险，即每一步保留k个最佳候选分支，每一步对k个候选分支进行处理，然后再将结果集削减至k个最可能成员

点击进入文档下载页（PPT格式）

共53页，可试读18页，点击继续阅读 ↓↓

点击下载（PPT格式）

浏览记录