电子科技大学：《机器学习 Machine Learning》课程教学资源（课件讲稿）第2讲模型评估与选择 Evaluation and Selection of Models

了解常用的性能度量理解常用的比较检验理解经验误差与过拟合掌握偏差与方差灵活运用评估方法

团购合买资源类别：文库，文档格式：PDF，文档页数：38，文件大小：1.37MB

电子科技大学研究生《机器学习》课程第2讲模型评估与选择 Lecture2 Evaluation and Selection of Models 郝家胜(Jiasheng Hao) Ph.D.,Associate Professor Email:hao@uestc.edu.cn School of Automation Engineering,Center for Robotics University of Electronics and Science of China,Chengdu 611731 参考：《机器学习》周志华

电子科技大学研究生《机器学习》课程 Email: hao@uestc.edu.cn School of Automation Engineering, Center for Robotics University of Electronics and Science of China, Chengdu 611731 郝家胜 (Jiasheng Hao) Ph.D., Associate Professor 参考：《机器学习》周志华第2讲模型评估与选择 Lecture2 Evaluation and Selection of Models

回顾：典型的机器学习过程更用字习算法(earing aigorithm 类别标记训练数据 (label) 训练模型什么模型好姓名职业年收入华好题客张目教丽 6万快策柄，神经网络，支特向量机，香至四公务员 7万是 Boosting,贝叶斯网络 ? 王五学生 2 + 否手六企业氢 15万 e+0 例如：错误率低、精度高.… 董士漂灵 ?=是 13万新数抵样本教师 8万是 (刘三，公务员，8万，能很好地适用于类别标记 unseen instance 未知泛化能力强！然而，我们手上没有unseen instance,怎么办？电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程什么模型好？能很好地适用于 unseen instance 例如：错误率低、精度高… 然而，我们手上没有unseen instance，怎么办? 泛化能力强！

模型选择(model selection) 三个关键问题：口如何获得测试结果？评估方法 ▣如何评估性能优劣？性能度量口如何判断实质差别？二→ 比较检验电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程模型选择(model selection) 三个关键问题： q 如何获得测试结果？ q 如何评估性能优劣？ q 如何判断实质差别？评估方法性能度量比较检验

本章标口理解经验误差与过拟合口了解常用的性能度量口理解常用的比较检验口掌握偏差与方差口灵活运用评估方法

q 了解常用的性能度量 q 理解常用的比较检验 q 理解经验误差与过拟合 q 掌握偏差与方差 q 灵活运用评估方法

大纲经验误差与过拟合评估方法性能度量 ▣ 比较检验 ▣ 偏差与方差电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程大纲 o 经验误差与过拟合 o 评估方法 o 性能度量 o 比较检验 o 偏差与方差

经验误差与过拟合口错误率&误差：错误率：错分样本的占E=a/m 误差：样本真实输出与预测输出之间的差异口训练（经验）误差：训练集上口测试误差：测试集口泛化误差：除训练集外所有样本冬泛化误差越小越好！由于事先并不知道新样本的特征，我门只能努力使经验误差最小化；冬经验误差是否越小越好？ Nol因为会出现“过拟合”(Overfitting) 电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程经验误差与过拟合 o 错误率&误差： n 错误率: 错分样本的占比： n 误差：样本真实输出与预测输出之间的差异 p 训练(经验)误差：训练集上 p 测试误差：测试集 p 泛化误差：除训练集外所有样本由于事先并不知道新样本的特征，我们只能努力使经验误差最小化； v 泛化误差越小越好！ v 经验误差是否越小越好？ No! 因为会出现“过拟合”（Overfitting）

经验误差与过拟合过拟合：学习器把训练样本学习的“太好”，将训练样本本身的特点当做所有样本的一般性质，导致泛化性能下降口优化目标加正则项 ▣ early stop 口欠拟合：对训练样本的一般性质尚未学好 ▣决策树：拓展分支 ▣神经网络：增加训练轮数过拟合是无法彻底避免的，我们只能缓解电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程经验误差与过拟合 o 过拟合: 学习器把训练样本学习的“太好” ，将训练样本本身的特点当做所有样本的一般性质，导致泛化性能下降 p 优化目标加正则项 p early stop o 欠拟合：对训练样本的一般性质尚未学好 p 决策树:拓展分支 p 神经网络:增加训练轮数过拟合是无法彻底避免的，我们只能缓解

经验误差与过拟合过拟合模型分类结果： >不是树叶树叶训练样本 (误以为树叶必须有锯齿) 新样本欠拟合模型分类结果： >是树叶 (误以为绿色的都是树叶) 过拟合、欠拟合的直观类比我门无法直接获得泛化误差，而训练误差又由于过拟合的存在而不适合作为标准，那现实中如何进行模型评估与选择呢？电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程经验误差与过拟合我们无法直接获得泛化误差，而训练误差又由于过拟合的存在而不适合作为标准，那现实中如何进行模型评估与选择呢？

大纲经验误差与过拟合评估方法性能度量比较检验偏差与方差电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程大纲 o 经验误差与过拟合 o 评估方法 o 性能度量 o 比较检验 o 偏差与方差

评估方法通过实险测试来对学习器的泛化误差进行评估并进而做出选择我们假设测试集是从样本真实分布中独立采样获得，将测试集上的测试误差”作为泛化误差的近似，所以测试集要和训练集中的样本尽量互斥。关键：怎么获得“测试集”(test set)? 电子科技大学研究生《机器学习》课程

电子科技大学研究生《机器学习》课程评估方法通过实验测试来对学习器的泛化误差进行评估并进而做出选择我们假设测试集是从样本真实分布中独立采样获得，将测试集上的“测试误差”作为泛化误差的近似，所以测试集要和训练集中的样本尽量互斥。关键：怎么获得“测试集”(test set)?

点击下载完整版文档（PDF格式）

共38页，可试读13页，点击继续阅读 ↓↓

点击下载（PDF格式）

浏览记录