《数据分析与管理决策》课程教学大纲 一、课程基本信息 课程代码:16038103 课程名称:数据分析与管理决策 英文名称:Business Analytics and Decision 课程类别:专业选修 时:48 学 分:3 适用对象:信息管理与信息系统、大数据管理与应用等专业 考核方式:考查 先修课程:python、管理统计、数据分析方法与工具 二、课程简介 中文简介 海量数据的存在、数据分析技术的讲光、计算能力的品著提高。这三二者共国导致了在商业管 理决策问题上使用分析方法的高潮。本课程的重点是商务数据分析方法,给学生提供一个完美的 概念认识,帮助学生了解商务数据分析在决策过程中的地位。商务数据分析是指通过一系列的科 学流程,讲数据转变为人质的信息,从而做出更好的决策。商务数据分析包括:描述性数据分析、 预测性数据分析和规范性数据分析,这些数据分析技术,可以帮助我们更好地做出决策。 英文简介 The existence of massive amounts of data,the advancement of analytical methodology,and the significant increase in computing power have all led to the use of analytical methods in business management decision-making issues.The focus of this course is on business data analysis methods,to provide students with a perfect conceptual understanding and help students understand the status of business data analysis in the decision-making process.Business data analysis refers to the transformation of data into information through a series of scientific processes to make better decisions.Business data analysis includes:descriptive data analysis,predictive data analysis and normative data analysis. These data analysis techniques can help us make better decisions 三、课程性质与教学目的 本课程是信息管理专业、大数据管理与应用专业的专业选修课。该课程通过介绍商务数据分 析的思想、方法,使学生掌握从历史数据中获取有用的认识、求解优化问题、对不确定性的决策 问题进行模拟分析的能力,培养学生能用商务数量解析的思想和方法,对不确定性问题进行建模
1 《数据分析与管理决策》课程教学大纲 一、课程基本信息 课程代码:16038103 课程名称:数据分析与管理决策 英文名称:Business Analytics and Decision 课程类别:专业选修 学 时:48 学 分:3 适用对象:信息管理与信息系统、大数据管理与应用等专业 考核方式:考查 先修课程:python 、管理统计、数据分析方法与工具 二、课程简介 中文简介 海量数据的存在、数据分析技术的进步、计算能力的显著提高,这三者共同导致了在商业管 理决策问题上使用分析方法的高潮。本课程的重点是商务数据分析方法,给学生提供一个完美的 概念认识,帮助学生了解商务数据分析在决策过程中的地位。商务数据分析是指通过一系列的科 学流程,讲数据转变为人质的信息,从而做出更好的决策。商务数据分析包括:描述性数据分析、 预测性数据分析和规范性数据分析,这些数据分析技术,可以帮助我们更好地做出决策。 英文简介 The existence of massive amounts of data,the advancement of analytical methodology, and the significant increase in computing power have all led to the use of analytical methods in business management decision-making issues. The focus of this course is on business data analysis methods, to provide students with a perfect conceptual understanding and help students understand the status of business data analysis in the decision-making process. Business data analysis refers to the transformation of data into information through a series of scientific processes to make better decisions. Business data analysis includes: descriptive data analysis, predictive data analysis and normative data analysis. These data analysis techniques can help us make better decisions. 三、课程性质与教学目的 本课程是信息管理专业、大数据管理与应用专业的专业选修课。该课程通过介绍商务数据分 析的思想、方法,使学生掌握从历史数据中获取有用的认识、求解优化问题、对不确定性的决策 问题进行模拟分析的能力,培养学生能用商务数量解析的思想和方法,对不确定性问题进行建模
和计算的能力。通过本课程的学习,使学生理解商务数据分析有助于我们做出更好的决策,知道 如何把数据分析方法成功的运用到各种各样问趣的解决中。 教学目的如下: 1:要求学生了解商务数据分析的应用领域,掌握数据数量解析分析的基本方法: 2:要求学生掌握时间序列分析、数据挖掘、线性优化、整数优化、Monte Carlo模拟、决策分 析基本原理,应能将其应用于解决实际问题: 3:要求学生掌握Python进行商务数量解析的使用方法,来计算商务数量解析中的问题: 4:要求学生能够对来经济、医药、交通等领域的数据进行综合分析,给出详实的分析报告 思政教有: 1,引导学生做事情时不应只满足基本要求,还应做好外围工作,上交的工作成果至少要做到自 己非常满意。以数据可视化、平时作业和毕业设计为例 2.慎重择友:人以群分,物以类聚:近朱者赤近墨者黑 3.合理安排时间:注意时间成本,做好统筹协调。做事情都应该做好规划,提高效率。 四、教学内容及要求 第一章商务数据分析概述 (一)目的与要求 1.掌握商务数据分析分类 2. 理解决策过程 3.理解大数据的含义 (二)教学内容 第一节 1.主要内容 1.1什么是决策3 1.2关于商务数量解析的界定4 1.3解析方法与模型的分类5 1.4大数据8 1.5商务数量解析学的应用8 2。基本概念和知识点 决策、商务数量解析、大数据、商务数量解析的分类 3.问题与应用(能力要求) 学生调研商务数据分析在各个领域的应用情况 (三)思考与实践 (四)教学方法与手段 主要采用课常讲授、多媒体教学、实脸等方法 2
2 和计算的能力。通过本课程的学习,使学生理解商务数据分析有助于我们做出更好的决策,知道 如何把数据分析方法成功的运用到各种各样问题的解决中。 教学目的如下: 1:要求学生了解商务数据分析的应用领域,掌握数据数量解析分析的基本方法; 2:要求学生掌握时间序列分析、数据挖掘、线性优化、整数优化、Monte Carlo 模拟、决策分 析基本原理,应能将其应用于解决实际问题; 3:要求学生掌握 Python 进行商务数量解析的使用方法,来计算商务数量解析中的问题; 4:要求学生能够对来经济、医药、交通等领域的数据进行综合分析,给出详实的分析报告。 思政教育: 1. 引导学生做事情时不应只满足基本要求,还应做好外围工作,上交的工作成果至少要做到自 己非常满意。以数据可视化、平时作业和毕业设计为例 2. 慎重择友:人以群分,物以类聚;近朱者赤近墨者黑 3. 合理安排时间:注意时间成本,做好统筹协调。做事情都应该做好规划,提高效率。 四、教学内容及要求 第一章 商务数据分析概述 (一) 目的与要求 1. 掌握商务数据分析分类 2. 理解决策过程 3. 理解大数据的含义 (二) 教学内容 第一节 1. 主要内容 1.1 什么是决策 3 1.2 关于商务数量解析的界定 4 1.3 解析方法与模型的分类 5 1.4 大数据 8 1.5 商务数量解析学的应用 8 2. 基本概念和知识点 决策、商务数量解析、大数据、商务数量解析的分类 3. 问题与应用(能力要求) 学生调研商务数据分析在各个领域的应用情况 (三) 思考与实践 (四)教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法
第二章描述性数据分析和数据可视化 (一)目的与要求 1.熟悉描述性统计分析 2。掌握数据可视化的常用方法 (二)数学内容 第一节数据描述性分析 】。主要内容 1.1数据:定义和目标16 1.2 数据的类型17 1.3Exce1中的数据修政20 1.4数据的分布24 1.5位置测度32 1.6变异性测量37 分布分析41 1.8两个变量之间相关关系47 2.基本概念和知识点 数据的定义、数据的分布、变异性测量、变量间相关关系 3.问题与应用(能力要求) 会进行数据描述性分析 第二节数据可视化 1.主要内容 2.1概术68 2.2表格70 23 常用图 2.4高级可视化方法96 2.5数据仪表盘99 思政教育:以数据可视化为例,引导学生做事情时不应只满足基本要求,还应做好外 围工作,上交的工作成果至少要做到自己非常满意。慎重择友:人以群分,物以类聚:近朱者赤 近墨者黑 3
3 第二章 描述性数据分析和数据可视化 (一) 目的与要求 1. 熟悉描述性统计分析 2. 掌握数据可视化的常用方法 (二) 教学内容 第一节 数据描述性分析 1. 主要内容 1.1 数据:定义和目标 16 1.2 数据的类型 17 1.3 Excel 中的数据修改 20 1.4 数据的分布 24 1.5 位置测度 32 1.6 变异性测量 37 1.7 分布分析 41 1.8 两个变量之间相关关系 47 2.基本概念和知识点 数据的定义、数据的分布、变异性测量、变量间相关关系 3.问题与应用(能力要求) 会进行数据描述性分析 第二节 数据可视化 1. 主要内容 2.1 概述 68 2.2 表格 70 2.3 常用图 79 2.4 高级可视化方法 96 2.5 数据仪表盘 99 思政教育:以数据可视化为例, 引导学生做事情时不应只满足基本要求,还应做好外 围工作,上交的工作成果至少要做到自己非常满意。慎重择友:人以群分,物以类聚;近朱者赤 近墨者黑
正弦波实例y=CO5(2πx, 2.基本概念和知识点 数据可视化、常用图、数据仪表盘 3.问题与应用(能力要求) 掌握数据可视化的常用方法 (三)思考与实践 案例讨论电影票房数据112 使用Python创建矩阵散点图和平行坐标图 实验1描述统计分析和数据可视化 (四)教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 第三章数据预测中的相关问题 【教学内容】 第 一节数据预测与预测建模 1、预测模型 预测模型的几何理解 ·基本概念讲解 ●Python实践课:预测模型中的一般线性回归模型和Logistic回归模型 2、预测模型参数估计的基本策略 第二节预测模型的评价 模型误差的评价指标和图形化评价工具 ·基本概念讲解 ·Python实践课:预测模型的评价指标和图形化评价工具 2、泛化误差的估计 ●基本概今讲解 ●理论Python实践课:不同复杂度模型下的训练误差和测试误羞 数据集的划分策略 ·基本概念讲解
4 2. 基本概念和知识点 数据可视化、常用图、数据仪表盘 3. 问题与应用(能力要求) 掌握数据可视化的常用方法 (三) 思考与实践 案例讨论 电影票房数据 112 使用 Python 创建矩阵散点图和平行坐标图 实验 1 描述统计分析和数据可视化 (四) 教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 第三章 数据预测中的相关问题 【教学内容】 第一节 数据预测与预测建模 1、预测模型和预测模型的几何理解 ⚫ 基本概念讲解 ⚫ Python 实践课:预测模型中的一般线性回归模型和 Logistic 回归模型 2、预测模型参数估计的基本策略 第二节 预测模型的评价 1、 模型误差的评价指标和图形化评价工具 ⚫ 基本概念讲解 ⚫ Python 实践课:预测模型的评价指标和图形化评价工具 2、 泛化误差的估计 ⚫ 基本概念讲解 ⚫ 理论 Python 实践课:不同复杂度模型下的训练误差和测试误差 3、 数据集的划分策略 ⚫ 基本概念讲解
●Python实践课:数据集划分以及测试误差估计 第三节预测模型的选择问题 1、模型过拟和 。基木概今进轻 ●Python实践课:模型的过拟合 2、预测模型的偏差和方差 ●基本概念讲解 ●Python实践课:模型的偏差和方差 第四章揭示数据内在结构:聚类分析 【教学内容】 第一节聚类分析一般问题 1、聚类分析的目的 2、聚类算法概述 3、聚类解的评价 4、聚类解的可视化 第二节基于质心的聚类模型:K均值聚类 1、K均值聚类基本过程 2、K均值聚类中的聚类数目 3、Python实践课:探讨K 均值聚类特点和确定聚类数目K的方法 第三节基于联通性的聚类模型:系统聚类 1、系统聚类的基本过程 2、系统聚类中距离的联通性测度 3、系统聚类中的聚类数目 4、Python实践课:探讨系统聚类过程和可视化工具 5、Python实我课:探讨聚类分析的实际应用 第四节基于高斯分布的聚类模型:EM聚类 1、基于高斯分布聚类的出发点:有限混合分布 2、EM聚类算法 3、Python实践课:探讨EM聚类的适用场景和聚类实现 思政教育:慎重择友:人以群分,物以类聚:近朱者赤近墨者黑 生活在我们周围的其他人的品格、生活方式、习惯和他们对事物的看法都有意无意地 在影响我们。有时,我们自己深受其影响而不自觉。好的行为规则无疑地对我们的生活具有指 导作用,而好的榜样发挥的作用则更大。榜样的行动是一种活生生的现身说法的救育,这种教 育最丰富、最生动、最富有感染力。 年轻人品格正在形成之中,慎重择友就显得十分重要。牛津大学的叶格卫斯先生坚定 地认为,年轻的朋友们在一起,极易形成一致意见,因为每一个人都易被对方所同化,因而大 伙儿易趋于一致。经常相聚的人,连讲话的腔调都十分近似。我们看一个人只须看他有些什么 5
5 ⚫ Python 实践课:数据集划分以及测试误差估计 第三节 预测模型的选择问题 1、模型过拟和 ⚫ 基本概念讲解 ⚫ Python 实践课:模型的过拟合 2、预测模型的偏差和方差 ⚫ 基本概念讲解 ⚫ Python 实践课:模型的偏差和方差 第四章 揭示数据内在结构:聚类分析 【教学内容】 第一节 聚类分析一般问题 1、聚类分析的目的 2、聚类算法概述 3、聚类解的评价 4、聚类解的可视化 第二节 基于质心的聚类模型:K-均值聚类 1、K-均值聚类基本过程 2、K-均值聚类中的聚类数目 3、Python 实践课:探讨 K-均值聚类特点和确定聚类数目 的方法 第三节 基于联通性的聚类模型:系统聚类 1、系统聚类的基本过程 2、系统聚类中距离的联通性测度 3、系统聚类中的聚类数目 4、Python 实践课:探讨系统聚类过程和可视化工具 5、Python 实践课:探讨聚类分析的实际应用 第四节 基于高斯分布的聚类模型:EM 聚类 1、基于高斯分布聚类的出发点:有限混合分布 2、EM 聚类算法 3、Python 实践课:探讨 EM 聚类的适用场景和聚类实现 思政教育:慎重择友:人以群分,物以类聚;近朱者赤近墨者黑 生活在我们周围的其他人的品格、生活方式、习惯和他们对事物的看法都有意无意地 在影响我们。有时,我们自己深受其影响而不自觉。好的行为规则无疑地对我们的生活具有指 导作用,而好的榜样发挥的作用则更大。榜样的行动是一种活生生的现身说法的教育,这种教 育最丰富、最生动、最富有感染力。 年轻人品格正在形成之中,慎重择友就显得十分重要。牛津大学的叶格卫斯先生坚定 地认为,年轻的朋友们在一起,极易形成一致意见,因为每一个人都易被对方所同化,因而大 伙儿易趋于一致。经常相聚的人,连讲话的腔调都十分近似。我们看一个人只须看他有些什么
样的朋友就行了。物以类聚,人以群分。选择一个好的朋友可能会成就自己的一生:选择一个 坏的伙伴,足以把自己毁掉 第五章线性回归分析 (一)目的与要求 1.熟悉简单线性回归模型 2.熟悉多元回归模型 3.掌捉回归推断分析 4.熟悉非线性回归模型 5.掌捏建模问题的解决 (二)教学内容 第一节 1.主要内容 1.1简单线性回归模型119 1.2最小二乘法121 1.3简单线性回归模型的拟合效果126 1.4多元回归模型130 1.5回归推断分析135 1.6属性自变量149 1.7非线性回归模型153 1.8建模问颗164 2.基本概念和知识点 线性回归模型、非线性回归模型、最小二乘法、回归推断分析、建模 3。问题与应用(能力要求) 能解决建模问题,会构建线性和非线性回归模型,能进行回归推断分析 (三)思考与实践 案例讨论校友捐赠178 利用Python进行回归分析179 实验2线性和非线性回归分析 (四)教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 第六章数据预测建模:贝叶斯分类器 【教学内容】 第一节贝叶斯概率和贝叶斯法则 贝叶斯概率和贝叶斯法则的基本内容 第二特 贝叶斯和朴素贝叶斯分类器 1、贝叶斯和朴素贝叶斯分类器的一般内容 6
6 样的朋友就行了。物以类聚,人以群分。选择一个好的朋友可能会成就自己的一生;选择一个 坏的伙伴,足以把自己毁掉。 第五章 线性回归分析 (一) 目的与要求 1. 熟悉简单线性回归模型 2. 熟悉多元回归模型 3. 掌握回归推断分析 4. 熟悉非线性回归模型 5. 掌握建模问题的解决 (二) 教学内容 第一节 1. 主要内容 1.1 简单线性回归模型 119 1.2 最小二乘法 121 1.3 简单线性回归模型的拟合效果 126 1.4 多元回归模型 130 1.5 回归推断分析 135 1.6 属性自变量 149 1.7 非线性回归模型 153 1.8 建模问题 164 2. 基本概念和知识点 线性回归模型、非线性回归模型、最小二乘法、回归推断分析、建模 3. 问题与应用(能力要求) 能解决建模问题,会构建线性和非线性回归模型,能进行回归推断分析 (三) 思考与实践 案例讨论 校友捐赠 178 利用 Python 进行回归分析 179 实验 2 线性和非线性回归分析 (四) 教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 第六章 数据预测建模:贝叶斯分类器 【教学内容】 第一节 贝叶斯概率和贝叶斯法则 贝叶斯概率和贝叶斯法则的基本内容 第二节 贝叶斯和朴素贝叶斯分类器 1、贝叶斯和朴素贝叶斯分类器的一般内容
2、贝叶斯分类器的先验分布 ● 基本概念讲解 ·Python实践课:探索不同参数下的贝塔分布特点 第三节贝叶斯分类器的分类边界 基本概念 井解 Pythor实践课:绘制贝叶斯分类器的决策边界 第四节贝叶斯分类器的应用实践 1、Python实践课:二分类的空气污染预测 2、Python实践课:多分类的文本分类预测 第七章数据预测建模:近邻分析和逻辑回归 【教学内容】 第一节近邻分析:K-近邻法 1、距离:K近邻法的近邻度量 2、参数K:1-近邻法还是K近邻法 基本概念讲解 ·Python实践课:K-近邻法不同参数K下的分类边界 第二节基于观测相似性的加权K近邻法 1、加权K-近邻法的权重和预测 2、加权K近邻法的分米边界 基本概念讲解 ·Python实践课:探讨加权K-近邻法中不同核函数的特点 第三节逻辑回归 第八章数据预测建模:决策树 【教学内容】 决策树的核心问题 1、什么是决策树 2、分类树的分类边界和回归树的回归平面 ●基本概念讲解 ●Python实践课:回归树的回归面 3、决策树的生长和剪枝 ●基本概念讲解 ●Python实践课:不同树深度下分类树的分类边界 第二节分类回归树的生长 1、分类树中的异质性府 ●基本概念讲解 Python实践课:分类树中的基尼系数和嫡 2、回归树中的异质性度量 第三节分类回归树的剪枝
7 2、贝叶斯分类器的先验分布 ⚫ 基本概念讲解 ⚫ Python 实践课:探索不同参数下的贝塔分布特点 第三节 贝叶斯分类器的分类边界 ⚫ 基本概念讲解 ⚫ Python 实践课:绘制贝叶斯分类器的决策边界 第四节 贝叶斯分类器的应用实践 1、Python 实践课:二分类的空气污染预测 2、Python 实践课:多分类的文本分类预测 第七章 数据预测建模:近邻分析 和逻辑回归 【教学内容】 第一节 近邻分析:K-近邻法 1、距离:K-近邻法的近邻度量 2、参数 :1-近邻法还是 K-近邻法 ⚫ 基本概念讲解 ⚫ Python 实践课:K-近邻法不同参数 下的分类边界 第二节 基于观测相似性的加权 K-近邻法 1、 加权 K-近邻法的权重和预测 2、加权 K-近邻法的分类边界 ⚫ 基本概念讲解 ⚫ Python 实践课:探讨加权 K-近邻法中不同核函数的特点 第三节 逻辑回归 第八章 数据预测建模:决策树 【教学内容】 第一节 决策树的核心问题 1、什么是决策树 2、分类树的分类边界和回归树的回归平面 ⚫ 基本概念讲解 ⚫ Python 实践课:回归树的回归面 3、决策树的生长和剪枝 ⚫ 基本概念讲解 ⚫ Python 实践课:不同树深度下分类树的分类边界 第二节 分类回归树的生长 1、分类树中的异质性度量 ⚫ 基本概念讲解 ⚫ Python 实践课:分类树中的基尼系数和熵 2、回归树中的异质性度量 第三节 分类回归树的剪枝
1、代价复杂度和最小代价复杂度 ●基本概念讲解 ·Python实践课:回归树和过拟合 2、分类回归树的剪枝过程 第四节决策树的应用实践 Python实践课:空气质量等级的分类预测 第九章数据预测津模:集成学习 【教学内容】 第一节集成学习的一般问题 1、集成学习:解决高方差问尼 2、集成学习: 从弱模型到强模型 第二节基于重抽样自举法的集成学习 1、重抽样自举法 2、袋转箭路 3、随机森林 4、Python实践课:探讨袋装策略和随机森林的方差 第三节集成学习:从弱模型到强模型 1、提升策略 ·基本概念讲解 。Python实践课 探讨提升策略集成学习的预测效果 AdaBoost..M算法 基本概念讲解 ·Python实践课:提升策略集成学习下高权重样本观测的变化 3、回归预测中的提升策路 ·基本概念讲解 Python实践讲 不同损失函数下AdaBoost回归预测 第四节梯度提升材 1、梯度提升算法 2、梯度提升回归超树 3、梯度提升分类杯 Python实践课 梯度提升算法和提升策略集成学习的对比 第五节XGBoost算法精要 1、XGBoost算法中的目标函数 2、目标函数的近似表达 3、决策树的求解 第六节集成学习的应用实毁 Python实践课 基 空气质量监测数据,对比集成学习的各种策略
8 1、 代价复杂度和最小代价复杂度 ⚫ 基本概念讲解 ⚫ Python 实践课:回归树和过拟合 2、分类回归树的剪枝过程 第四节 决策树的应用实践 Python 实践课:空气质量等级的分类预测 第九章 数据预测建模:集成学习 【教学内容】 第一节 集成学习的一般问题 1、集成学习:解决高方差问题 2、集成学习:从弱模型到强模型 第二节 基于重抽样自举法的集成学习 1、重抽样自举法 2、袋装策略 3、随机森林 4、Python 实践课:探讨袋装策略和随机森林的方差 第三节 集成学习:从弱模型到强模型 1、 提升策略 ⚫ 基本概念讲解 ⚫ Python 实践课:探讨提升策略集成学习的预测效果 2、 AdaBoost.M1 算法 ⚫ 基本概念讲解 ⚫ Python 实践课:提升策略集成学习下高权重样本观测的变化 3、 回归预测中的提升策略 ⚫ 基本概念讲解 ⚫ Python 实践课:不同损失函数下 AdaBoost 回归预测 第四节 梯度提升树 1、梯度提升算法 2、梯度提升回归树 3、梯度提升分类树 4、Python 实践课:梯度提升算法和提升策略集成学习的对比 第五节 XGBoost 算法精要 1、XGBoost 算法中的目标函数 2、目标函数的近似表达 3、决策树的求解 第六节 集成学习的应用实践 Python 实践课:基于空气质量监测数据,对比集成学习的各种策略
第十章特征提取:空间变换策路 【教学内容】 第一节主成分分 1、主成分分析的基本出发点 2、主成分分析的基本原理 3、确定主成分 4、Python实践课:探讨主成分分析的基本原理和实践 第一节矩阵的奇异值分解 1、奇异值分解的基本思路 2、基于奇异值分解的特征提取 3、Pythor实践课:基于脸部点阵灰度数据,探讨奇异值分解的应用 第三节因子分析 1、因子分析的基本出发点 2、因子分析的基本原理 3、因子载荷矩阵的求解 4、因子得分的计算 5、Python实践课:探讨因子分析的基本原理 6、Python实践课:基于空气质量监测数据,探讨因子分析的应用 第十一章特征选择:过滤、包裹和嵌入策略 【散学内容】 第一节过滤式策略下的特征选择 1、低方弟过波法 分类预测中的高相关过滤法:下统计量 ·基本概念讲解 ●Python实践课:探索高相关过滤法中的F分布特点及应用 2、分类预测中的高相关过滤法:X统计量 ●基本概念讲解 ●Pytho实践课:探索高相关过滤法中卡方分布特点及应用 4、Python实践课:探讨低方差过滤法的应用意义 第二节包裹式策略下的特征选择 1、包裹式策略的基本思路 2、递归式特征别除法 3、Python实践课:探索包裹式策略下的特征选择及应用 第三节嵌入式策略下的特征选择 1、岭回归和Las0回归 ●基本概②讲解 ●Python实践课:探索Lasso回归中收缩参数a变化对特征选择的影响
9 第十章 特征提取:空间变换策略 【教学内容】 第一节 主成分分析 1、主成分分析的基本出发点 2、主成分分析的基本原理 3、确定主成分 4、Python 实践课:探讨主成分分析的基本原理和实践 第二节 矩阵的奇异值分解 1、奇异值分解的基本思路 2、基于奇异值分解的特征提取 3、Python 实践课:基于脸部点阵灰度数据,探讨奇异值分解的应用 第三节 因子分析 1、因子分析的基本出发点 2、因子分析的基本原理 3、因子载荷矩阵的求解 4、因子得分的计算 5、Python 实践课:探讨因子分析的基本原理 6、Python 实践课:基于空气质量监测数据,探讨因子分析的应用 第十一章 特征选择:过滤、包裹和嵌入策略 【教学内容】 第一节 过滤式策略下的特征选择 1、低方差过滤法 1、 分类预测中的高相关过滤法: 统计量 ⚫ 基本概念讲解 ⚫ Python 实践课:探索高相关过滤法中的 F 分布特点及应用 2、 分类预测中的高相关过滤法: 统计量 ⚫ 基本概念讲解 ⚫ Python 实践课:探索高相关过滤法中卡方分布特点及应用 4、Python 实践课:探讨低方差过滤法的应用意义 第二节 包裹式策略下的特征选择 1、包裹式策略的基本思路 2、递归式特征剔除法 3、Python 实践课:探索包裹式策略下的特征选择及应用 第三节 嵌入式策略下的特征选择 1、岭回归和 Lasso 回归 ⚫ 基本概念讲解 ⚫ Python 实践课:探索 Lasso 回归中收缩参数 变化对特征选择的影响
2、弹性网回归 ●基本概念讲解 ·Python实践课:探索弹性网回归中不同L1正则化率变化对模型的影响 第十二章时间序列分析与预测 (一)目的与要求 1.掌握时间序列的集中类型 2.理解预测精度问题 3.熟悉移动平均和指数平滑法 4.熟悉回归预测分析 5.掌握预测模型优良性评估 (二)教学内容 第一节 1.主要内容 1.1时间序列的几种类型184 1.2预测精度问题190 1.3移动平均与指数平滑法194 1.4回归预测分析202 1.5预测模型优良性评估211 2.基本概念和知识点 时间序列、移动平均与指数平滑法、回归预测分析 3.问题与应用(能力要求》 能进行时间序列预测分析 (三)思考与实践 案例讨论食品和饮料销售预测分析222 使用Python做预测分析222 实验3时间序列分析与预测 (四)教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 思政教育:合理安排时间:注意时间成本,做好统筹协调。 做事情都应该做好规划,提高效率做好统筹协调。我们应该注意做好统筹协调 在任何情况下,做事情都应该计划好,而且,如果规划好可以同时做几件事,提高效率」 注意时间成本。高效利用时间才是最重要的!做任何事情都有时间成本,合理规 划,可以节约时间成本。 合理安排时间和学习,保持良好的生活习惯。 10
10 2、弹性网回归 ⚫ 基本概念讲解 ⚫ Python 实践课:探索弹性网回归中不同 L1 正则化率变化对模型的影响 第十二章 时间序列分析与预测 (一) 目的与要求 1. 掌握时间序列的集中类型 2. 理解预测精度问题 3. 熟悉移动平均和指数平滑法 4. 熟悉回归预测分析 5. 掌握预测模型优良性评估 (二) 教学内容 第一节 1. 主要内容 1.1 时间序列的几种类型 184 1.2 预测精度问题 190 1.3 移动平均与指数平滑法 194 1.4 回归预测分析 202 1.5 预测模型优良性评估 211 2. 基本概念和知识点 时间序列、移动平均与指数平滑法、回归预测分析 3. 问题与应用(能力要求) 能进行时间序列预测分析 (三)思考与实践 案例讨论 食品和饮料销售预测分析 222 使用 Python 做预测分析 222 实验 3 时间序列分析与预测 (四)教学方法与手段 主要采用课堂讲授、多媒体教学、实验等方法 思政教育:合理安排时间:注意时间成本,做好统筹协调。 做事情都应该做好规划,提高效率 做好统筹协调。我们应该注意做好统筹协调 在任何情况下,做事情都应该计划好,而且,如果规划好可以同时做几件事,提高效率。 注意时间成本。高效利用时间才是最重要的!做任何事情都有时间成本,合理规 划,可以节约时间成本。 合理安排时间和学习,保持良好的生活习惯