《商务大数据分析》课程教学大纲 一、课程基本信息 课程代码:18100103 课程名称:商务大数据分析 英文名称:Business Big Data Analysis 课程类别:专业课 时:48 学 分:3 适用对象:数据科学与大数据技术 老核方式:老试 先修课程:概率论与数理统计 二、课程简介 《商务大数据分析》是综合了机器学习、统计和数据库的一门现代计算机技术,旨在发现海 量数据中的模型与模式,具有巨大的应用前景。在很多重要的领域,大数据挖据和分析都发挥着 积极的作用。因此这门课程是数据科学与大数据技术及相关专业的重要课程之一。 本课程的主要内容包括:数据挖掘基础、MATLAB数据分析工具箱简介、数据探索、数据预 处理、挖掘建模等。 Business Big Data Analysis is a modem computer technology that combines machine learmning.statistics and databases,aiming to discover models and patterns in large amounts of data.Big data mining and analytics play an active role in many important areas. Therefore,this course is one of the most important courses in data science and big data technology and related majors. The main contents of this course include:data mining foundation,introduction of MATLAB data analysis toolbox,data exploration,data pre-processing.mining modeling. etc 三、课程性质与教学目的 本课程是数据科学与大数据技术专业任选课程,通过本课程的学习使学生罩握数 据挖掘的基本概念,了解数据挖掘的定义和功能以及实现数据挖掘的主要步骤和具体 实现方法,初步掌握数据挖掘的算法。学生在学习本课程后,将能实现简单的数据挖 掘算法编程,了解实现数据挖掘的具体操作。注重培养大数据思维,提高数据建模能 力以解决现实生活、经济社会中的实际问题。 四、教学内容及要求 第一章数据挖掘基础
1 《商务大数据分析》课程教学大纲 一、课程基本信息 课程代码:18100103 课程名称:商务大数据分析 英文名称:Business Big Data Analysis 课程类别:专业课 学 时:48 学 分:3 适用对象: 数据科学与大数据技术 考核方式:考试 先修课程:概率论与数理统计 二、课程简介 《商务大数据分析》是综合了机器学习、统计和数据库的一门现代计算机技术,旨在发现海 量数据中的模型与模式,具有巨大的应用前景。在很多重要的领域,大数据挖掘和分析都发挥着 积极的作用。因此这门课程是数据科学与大数据技术及相关专业的重要课程之一。 本课程的主要内容包括:数据挖掘基础、MATLAB 数据分析工具箱简介、数据探索、数据预 处理、挖掘建模等。 Business Big Data Analysis is a modern computer technology that combines machine learning, statistics and databases, aiming to discover models and patterns in large amounts of data. Big data mining and analytics play an active role in many important areas. Therefore, this course is one of the most important courses in data science and big data technology and related majors. The main contents of this course include: data mining foundation, introduction of MATLAB data analysis toolbox, data exploration, data pre-processing, mining modeling, etc. 三、课程性质与教学目的 本课程是数据科学与大数据技术专业任选课程,通过本课程的学习使学生掌握数 据挖掘的基本概念,了解数据挖掘的定义和功能以及实现数据挖掘的主要步骤和具体 实现方法,初步掌握数据挖掘的算法。学生在学习本课程后,将能实现简单的数据挖 掘算法编程,了解实现数据挖掘的具体操作。注重培养大数据思维,提高数据建模能 力以解决现实生活、经济社会中的实际问题。 四、教学内容及要求 第一章 数据挖掘基础
(一)目的与要求 1.了解数据挖掘的基本任务 2.介绍数据挖掘的建模过程 (二)教学内容 第一节某知名连锁餐饮企业的困惑 1.主要内容 介绍某餐饮企业目前已上线的管理系统,从而引出数据挖掘的思想 2.基本概念和知识点 管理系统 3.问题与应用(能力要求) 如何从大量历史数据中帮助企业洞察商机? 第二节从餐饮服务到数据挖掘 1.主要内容 介绍餐饮企业面临的问题和对策,指出不足,介绍数据挖掘的概念 2.基本概念和知识点 数据挖掘的概 3.问题与应用(能力要求 讨论传统数据分析与数据挖掘的关系。 第三节数据挖掘的基本任务 1.主要内容 结合案例,介绍数据挖掘的基本任务 2.基本概念和知识点 数据挖掘的基本任务 3.问题与应用(能力要求) 无 第四节数据挖掘的建模过程 1.主要内容 结合案例,介绍数据挖掘的建模过程 2.基本概念和知识点 数据取样、数据探索、数据预处理、挖掘建模、模型评价 3.问题与应用(能力要求) 几种采样方式的区别 (三)思考与实践 介绍近年来国家大力扶持大数据产业的政策和实例,指出大数据技术是 朝阳产业,大有前途,鼓励学生努力掌握相关技术。 2
2 (一)目的与要求 1.了解数据挖掘的基本任务 2.介绍数据挖掘的建模过程 (二)教学内容 第一节 某知名连锁餐饮企业的困惑 1.主要内容 介绍某餐饮企业目前已上线的管理系统,从而引出数据挖掘的思想 2.基本概念和知识点 管理系统 3.问题与应用(能力要求) 如何从大量历史数据中帮助企业洞察商机? 第二节 从餐饮服务到数据挖掘 1.主要内容 介绍餐饮企业面临的问题和对策,指出不足,介绍数据挖掘的概念 2.基本概念和知识点 数据挖掘的概念 3.问题与应用(能力要求) 讨论传统数据分析与数据挖掘的关系。 第三节 数据挖掘的基本任务 1.主要内容 结合案例,介绍数据挖掘的基本任务 2.基本概念和知识点 数据挖掘的基本任务 3.问题与应用(能力要求) 无 第四节 数据挖掘的建模过程 1.主要内容 结合案例,介绍数据挖掘的建模过程 2.基本概念和知识点 数据取样、数据探索、数据预处理、挖掘建模、模型评价 3.问题与应用(能力要求) 几种采样方式的区别 (三)思考与实践 介绍近年来国家大力扶持大数据产业的政策和实例,指出大数据技术是 朝阳产业,大有前途,鼓励学生努力掌握相关技术
(四)教学方法与手段 课堂讲授结合多媒体教学 第二章MATLAB数据挖掘分析工具箱 (一)目的与要求 1.掌握MATLAB的基本操作 2.了解与数据挖掘有关的工具箱 (二)教学内容 第一节MATLAB的安装 1.主要内容 介绍MATLAB的安装过程 2.基本概念和知识点 MATLAB的安装 3.问题与应用(能力要求) MATLAB试用版的安装操作 第二节MATLAB使用入门 1.主要内容 演示操作界面、介绍常用的操作和函数 2.基本概念和知识点 几个常用的函数 3.问题与应用(能力要求) 使用plot函数上机作图 第三节MATLAB数据分析工具箱 1.主要内容 介绍与数据分析和挖掘有关的工具箱 2.基本今和知识点 统计工具箱、曲线拟合工具箱、优化工具箱、神经网络工具箱 3.问题与应用(能力要求) 上机操作了解这几个工具箱的Demo. (二)思老与实 MATLAB是强大的工业软件,也是我国的“卡脖子”技术之一,鼓励学生 树立远大志向,投身关键技术的研究和实践。 (四)教学方法与手段 课堂讲授结合多媒体教学,上机实操 第三章数据探索
3 (四)教学方法与手段 课堂讲授结合多媒体教学 第二章 MATLAB 数据挖掘分析工具箱 (一)目的与要求 1.掌握 MATLAB 的基本操作 2.了解与数据挖掘有关的工具箱 (二)教学内容 第一节 MATLAB 的安装 1.主要内容 介绍 MATLAB 的安装过程 2.基本概念和知识点 MATLAB 的安装 3.问题与应用(能力要求) MATLAB 试用版的安装操作 第二节 MATLAB 使用入门 1.主要内容 演示操作界面、介绍常用的操作和函数 2.基本概念和知识点 几个常用的函数 3.问题与应用(能力要求) 使用 plot 函数上机作图 第三节 MATLAB 数据分析工具箱 1.主要内容 介绍与数据分析和挖掘有关的工具箱 2.基本概念和知识点 统计工具箱、曲线拟合工具箱、优化工具箱、神经网络工具箱 3.问题与应用(能力要求) 上机操作了解这几个工具箱的 Demo. (三)思考与实践 MATLAB 是强大的工业软件,也是我国的“卡脖子”技术之一,鼓励学生 树立远大志向,投身关键技术的研究和实践。 (四)教学方法与手段 课堂讲授结合多媒体教学,上机实操 第三章 数据探索
(一)目的与要求 1.介绍数据探索的基本方法 2.掌握数据探索的常用方法和MATLAB实现 (二)教学内容 第一节数据质量分析 1.主要内容 对数据中的缺失值、异常值和一致性进行分析 2.基本概念和知识点 缺失值分析、异常值分析 一致性分析 3.问题与应用(能力要求) 通过案例,掌握箱型图分析的MATLAB方法 第二节数据特征分析 1.主要内容 通过绘制图表、计算特征量等手段进行数据特征分析 2.基本概念和知识点 分布分析、对比分析、统计量分析、周期性分析、贡献度分析、相关 性分析 3.问题与应用(能力要求) 上机操作,掌握以上几种分析的MATLAB方法 (三)思考与实践 运用本章所学方法对广州市的经济数据作初步的分析,了解国民经济的 运行状况。 (四)教学方法与手段 课堂讲授结合多媒体教学,上机操作 第四章数据预处理 (一)目的与要求 1.掌握几种数据预处理算法 2.会用MATLAB处理实际数据 (二)教学内容 第一节数据清洗 1.主要内容 缺失值和异常值的处理 2.基本概念和知识点 拉格朗日插值法、牛顿插值法
4 (一)目的与要求 1.介绍数据探索的基本方法 2.掌握数据探索的常用方法和 MATLAB 实现 (二)教学内容 第一节 数据质量分析 1.主要内容 对数据中的缺失值、异常值和一致性进行分析 2.基本概念和知识点 缺失值分析、异常值分析、一致性分析 3.问题与应用(能力要求) 通过案例,掌握箱型图分析的 MATLAB 方法 第二节 数据特征分析 1.主要内容 通过绘制图表、计算特征量等手段进行数据特征分析 2.基本概念和知识点 分布分析、对比分析、统计量分析、周期性分析、贡献度分析、相关 性分析 3.问题与应用(能力要求) 上机操作,掌握以上几种分析的 MATLAB 方法 (三)思考与实践 运用本章所学方法对广州市的经济数据作初步的分析,了解国民经济的 运行状况。 (四)教学方法与手段 课堂讲授结合多媒体教学,上机操作 第四章 数据预处理 (一)目的与要求 1.掌握几种数据预处理算法 2.会用 MATLAB 处理实际数据 (二)教学内容 第一节 数据清洗 1.主要内容 缺失值和异常值的处理 2.基本概念和知识点 拉格朗日插值法、牛顿插值法
3.问题与应用(能力要求) 上机操作,用两种插值法处理销量数据 第二节数据集成 1.主要内容 将多个数据源合并到一个一致的数据存储中 2.基本概念和知识点 实体识别、冗余属性识别 3.问题与应用(能力要求)》 思考用相关性分析检测冗余属性 第三节数据变换 1.主要内容 如何对数据进行规范化处理 2基本概今和知识占 简单函数变换、几种规范化公式、连续属性离散化、属性构造 3.问顺与应用(能力要求) 上机操作,对实际数据进行规范化处理 第四节数据规约 1.主要内容 如何产生更小的但保持原数据集完整性的新数据集 2.基本概念和知识点 属性规约、数值规约 3.问题与应用(能力要求) 上机操作,利用主成分分析降维 (三)思考与实践 上机操作,掌握插值法和主成分分析法 (四)教学方法与手段 课堂讲授结合多媒体教学,上机操作 第五章挖掘建模 (一)目的与要求 1.掌握分类与预测、聚类分析、时序模式等算法的思想与步骤 2.会用几种常用算法解决实际问题 3.理解算法的评价指标 (二)教学内容 第一节分类与预测
5 3.问题与应用(能力要求) 上机操作,用两种插值法处理销量数据 第二节 数据集成 1.主要内容 将多个数据源合并到一个一致的数据存储中 2.基本概念和知识点 实体识别、冗余属性识别 3.问题与应用(能力要求) 思考用相关性分析检测冗余属性 第三节 数据变换 1.主要内容 如何对数据进行规范化处理 2.基本概念和知识点 简单函数变换、几种规范化公式、连续属性离散化、属性构造 3.问题与应用(能力要求) 上机操作,对实际数据进行规范化处理 第四节 数据规约 1.主要内容 如何产生更小的但保持原数据集完整性的新数据集 2.基本概念和知识点 属性规约、数值规约 3.问题与应用(能力要求) 上机操作,利用主成分分析降维 (三)思考与实践 上机操作,掌握插值法和主成分分析法 (四)教学方法与手段 课堂讲授结合多媒体教学,上机操作 第五章 挖掘建模 (一)目的与要求 1.掌握分类与预测、聚类分析、时序模式等算法的思想与步骤 2.会用几种常用算法解决实际问题 3.理解算法的评价指标 (二)教学内容 第一节 分类与预测
1.主要内容 理解分类与预测的基本思想和实现过程,掌握Logistic回归、人工神经 网络,理解算法评价指标 2.基本概念和知识点 分类与预测的实现过程、回归分析、Logistic回归、人工神经网络、分 类与预测算法的评价 3.问题与应用(能力要求) 上机操作,用Logistic回归和BP神经网络解决分类问题 第二节聚类分析 1.主要内容 聚类分析与分类的区别,K-means聚类算法的思想与步骤,聚类分析算法 评价 2.基本概念和知识点 聚类分析、K-means聚类算法、算法的评价指标 3.问题与应用(能力要求) 上机操作,用聚类分析算法对客户群分类,并评估其价值 第四节时序模式 1.主要内容 时间序列的数学表达,常用时间序列算法,ARA模型和ARIMA模型 2.基本概念和知识点 时间序列、时间序列的预处理、平稳时间序列分析、差分平稳时间序列 分析 3.问题与应用(能力要求 上机操作,建立时序模型进行预测 (三)思考与实践 几种典型的数据挖掘模型的思想和应用 (四)教学方法与手段 课微讲授结合多媒体教学,上机操作 石 、各教学环节学时分配 散学环节 讲 少 其他 教学时数 题 实验 实习 教学 环节 课程内容
6 1.主要内容 理解分类与预测的基本思想和实现过程,掌握 Logistic 回归、人工神经 网络,理解算法评价指标 2.基本概念和知识点 分类与预测的实现过程、回归分析、Logistic 回归、人工神经网络、分 类与预测算法的评价 3.问题与应用(能力要求) 上机操作,用 Logistic 回归和 BP 神经网络解决分类问题 第二节 聚类分析 1.主要内容 聚类分析与分类的区别,K-means 聚类算法的思想与步骤,聚类分析算法 评价 2.基本概念和知识点 聚类分析、K-means 聚类算法、算法的评价指标 3.问题与应用(能力要求) 上机操作,用聚类分析算法对客户群分类,并评估其价值 第四节 时序模式 1.主要内容 时间序列的数学表达,常用时间序列算法,ARMA 模型和 ARIMA 模型 2.基本概念和知识点 时间序列、时间序列的预处理、平稳时间序列分析、差分平稳时间序列 分析 3.问题与应用(能力要求) 上机操作,建立时序模型进行预测 (三)思考与实践 几种典型的数据挖掘模型的思想和应用 (四)教学方法与手段 课堂讲授结合多媒体教学,上机操作 五、各教学环节学时分配 教学环节 教学时数 课程内容 讲 课 习 题 课 讨 论 课 实验 实习 其他 教学 环节 小 计
第一章 4 第二章 第三章 6 10 第四章 第五章 10 18 合计 18 48 六、课程考核 (一)考核方式:闭卷考试 (二)成绩构成 平时成绩占比:30-40% 期末考试占比:60-70% (三)成绩考核标准 闭卷考试,满分100分,总成绩60分以上为及格。 七、推荐教材和教学参考资源 1.张良均等,MATLAB数据分析与挖掘实战,机械工业出版社,2015 2.张良均.数据挖掘:实用案例分析.机械工业出版社,2013 八、其他说明 无 大纲修订人:张宇山 修订日期:2022-9-1 大纲审定人: 审定日期: 7
7 第一章 4 4 第二章 2 2 4 第三章 6 4 10 第四章 8 4 12 第五章 10 8 18 合计 30 18 48 六、课程考核 (一)考核方式:闭卷考试 (二)成绩构成 平时成绩占比:30-40% 期末考试占比:60-70% (三)成绩考核标准 闭卷考试,满分 100 分,总成绩 60 分以上为及格。 七、推荐教材和教学参考资源 1. 张良均等,MATLAB 数据分析与挖掘实战,机械工业出版社,2015 2. 张良均. 数据挖掘:实用案例分析. 机械工业出版社,2013 八、其他说明 无 大纲修订人:张宇山 修订日期:2022-9-1 大纲审定人: 审定日期: