《工程数据分析》课程实验教学大纲 英文:Engineering Data Analysis 一、课程基本信息(黑体/小四) 课程代码:16060203 课程名称:工程数据分析 英文名称:Engineering Data Analysis 实验总学时:16 适用专业:计算机科学与技术本科 课程类别:专业课 先修课程:《程序设计》、《高等数学》等 二、实验教学的总体目的和要求 1、对学生的要求 通过本课程实验,使学生熟悉MATLAB的基本操作,熟悉基本的矩阵运算, 熟悉常用函数的使用方法,掌握与工程数据分析中常用方法对应的模块的调用方 法和编程实现。 2、对教师的要求 3、对实验条件的要求 个人计算机,Windows Xp及以上操作系统,MATLAB2010及以上 三、实验教学内容(黑体/小四) 实验项目一 实验名称:MATLAB基础 实验内容:MATLAB界面 命令窗口和编辑器的使用、矩阵的创建、矩阵运算 常用工具函数、程序结构和文件调用。 实验性质:验证性 实验学时:2
《工程数据分析》课程实验教学大纲 英文:Engineering Data Analysis 一、课程基本信息(黑体/小四) 课程代码: 16060203 课程名称:工程数据分析 英文名称: Engineering Data Analysis 实验总学时:16 适用专业:计算机科学与技术本科 课程类别:专业课 先修课程:《程序设计》、《高等数学》等 二、实验教学的总体目的和要求 1、对学生的要求 通过本课程实验,使学生熟悉 MATLAB 的基本操作,熟悉基本的矩阵运算, 熟悉常用函数的使用方法,掌握与工程数据分析中常用方法对应的模块的调用方 法和编程实现。 2、对教师的要求 3、对实验条件的要求 个人计算机,Windows Xp 及以上操作系统,MATLAB 2010 及以上 三、实验教学内容(黑体/小四) 实验项目一 实验名称:MATLAB 基础 实验内容:MATLAB 界面、命令窗口和编辑器的使用、矩阵的创建、矩阵运算、 常用工具函数、程序结构和文件调用。 实验性质:验证性 实验学时:2
实验目的与要求:熟悉MATLAB工作界面、掌握矩阵的创建、矩阵运算和常用工 具函数的使用,掌握编辑器的使用、会写简单程序,了解文件调用的常用函数 实验条件:Windows Xp及以上操作系统,MATLAB2012 实验项目二 实验名称:数据预处理与主成分分析 实验内容:给定一组数据,①对数据进行归一化处理:②对数据进行平滑处理: ③利用主成分分析方法对数据进行降维,分析降维后的数据与原始数据在数据空 间的分布变化 实验性质:验证性 实验学时:2 实验目的与要求:掌握对数据进行归一化和数据平滑的MATLAB函数的使用方法, 理解数据归一化和平滑的物理意义。掌握利用MATLAB进行主成分分析的计算步 骤:掌握选择主成分个数的原则以及利用特征值建立权向量的方法:能根据主成 分的数学公式,针对实际问题给出主成分的合理解释。 实验条件:Windows Xp及以上操作系统,MATLAB2012 研究与思考:主成分分析的几何意义是什么?当数据分布在一个超球形区域时, 用PCA降维是否有意义? 实验项目三 实验名称:数据统计量及其分布检验 实验内容:给定1949年到1990年我国洪涝灾害统计数据,解决以下问题:1) 计算各项指标的平均值、标准差、变异系数、三均值、偏度与峰度:2)各项指 标是否服从正态分布?若服从,计算概率为1%时的受灾面积、受灾人口及直接 经济损失:若不付出正态分布,利用B0x-Cox变换将数据进行变换,对变换后的 数据进行相应的分析。 实验性质:验证性 实验学时:2
实验目的与要求:熟悉 MATLAB 工作界面、掌握矩阵的创建、矩阵运算和常用工 具函数的使用,掌握编辑器的使用、会写简单程序,了解文件调用的常用函数。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 实验项目二 实验名称:数据预处理与主成分分析 实验内容:给定一组数据,①对数据进行归一化处理;②对数据进行平滑处理; ③利用主成分分析方法对数据进行降维,分析降维后的数据与原始数据在数据空 间的分布变化 实验性质:验证性 实验学时:2 实验目的与要求:掌握对数据进行归一化和数据平滑的 MATLAB 函数的使用方法, 理解数据归一化和平滑的物理意义。掌握利用 MATLAB 进行主成分分析的计算步 骤;掌握选择主成分个数的原则以及利用特征值建立权向量的方法;能根据主成 分的数学公式,针对实际问题给出主成分的合理解释。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:主成分分析的几何意义是什么?当数据分布在一个超球形区域时, 用 PCA 降维是否有意义? 实验项目三 实验名称:数据统计量及其分布检验 实验内容:给定 1949 年到 1990 年我国洪涝灾害统计数据,解决以下问题:1) 计算各项指标的平均值、标准差、变异系数、三均值、偏度与峰度;2)各项指 标是否服从正态分布?若服从,计算概率为 1%时的受灾面积、受灾人口及直接 经济损失;若不付出正态分布,利用 Box-Cox 变换将数据进行变换,对变换后的 数据进行相应的分析。 实验性质:验证性 实验学时:2
实验目的与要求:熟练掌握利用MATLAB计算均值、方差、协方差、相关系数、 笑与度异系敌他度与美厚中的分招超安 握jbt i1 lietes 关千 握多维数据的数字特征与相关矩阵的处理方法。 实验条件:Windows Xp及以上操作系统,MATLAB2012 研究与思考:变换数据分析结果的合理性? 实验项目四 实验名称:回归分析 实验内容:根据1990-2013我国工业总产值、农业总产值、建筑业总产值、社会 商品零售总额、全民人口数和年度财政收入数据,1)建立财政收入的多元回归 分析模型:2)用逐步回归法分析影响国家财政收入的主要因素并建立回归模型。 实验性质:验证性 实验学时:2 实验目的与要求:掌握线性同归摸型的律立方法,堂握下® ess及同归分析类的 命令使用方法:掌握编程求总离差平 方和TSS、回归平方和RSS、残 差平 方和ESS 等相关统计量: 了解逐步回归的思想方法,掌握stepwise命令的使用方法:掌 握残差分析方法。 实验条件:Windows Xp及以上操作系统,MATLAB2012 研究与思考:根据1990-2013我国工业总产值、农业总产值、建筑业总产值、社 会商品零售总额、全民人口数和年度财政收入数据的变化,你对我国社会健康发 展有何感想? 实验项目五 实验名称:判决分析 实验内容:手写数字识别是模式识别的经典问题。NIST是一个手写数字的公开数 据。将图像一值化, 然后将其划分成4*4的小块,统计每个小块中黑色点的个 数,形成个49维的向量作为描述手写数字的指标向量或特征向量 1)分别采 用欧氏距离和马氏距离的最小距离判决对测试样本进行判决,并统计各自的正确 率:2)假设每个数字出现的概率相同,并且各类样本均服从多维正态分布,用 最小错误贝叶斯决策对测试样本进行判决,并统计各自的正确率:3)比较各种
实验目的与要求:熟练掌握利用 MATLAB 计算均值、方差、协方差、相关系数、 标准差与变异系数、偏度与峰度、中位数、分位数、三均值、四分位极差与极差; 掌握 jbtest 与 lillietest 关于一维数据的正态性检验;掌握统计作图方法;掌 握多维数据的数字特征与相关矩阵的处理方法。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:变换数据分析结果的合理性? 实验项目四 实验名称:回归分析 实验内容:根据 1990-2013 我国工业总产值、农业总产值、建筑业总产值、社会 商品零售总额、全民人口数和年度财政收入数据,1)建立财政收入的多元回归 分析模型;2)用逐步回归法分析影响国家财政收入的主要因素并建立回归模型。 实验性质:验证性 实验学时:2 实验目的与要求:掌握线性回归模型的建立方法,掌握 regress 及回归分析类的 命令使用方法;掌握编程求总离差平方和 TSS、回归平方和 RSS、残差平方和 ESS 等相关统计量;了解逐步回归的思想方法,掌握 stepwise 命令的使用方法;掌 握残差分析方法。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:根据 1990-2013 我国工业总产值、农业总产值、建筑业总产值、社 会商品零售总额、全民人口数和年度财政收入数据的变化,你对我国社会健康发 展有何感想? 实验项目五 实验名称:判决分析 实验内容:手写数字识别是模式识别的经典问题。MNIST是一个手写数字的公开数 据集。将图像二值化,然后将其划分成4* 4的小块,统计每个小块中黑色点的个 数,形成一个49维的向量作为描述手写数字的指标向量或特征向量。 1)分别采 用欧氏距离和马氏距离的最小距离判决对测试样本进行判决,并统计各自的正确 率;2)假设每个数字出现的概率相同,并且各类样本均服从多维正态分布,用 最小错误贝叶斯决策对测试样本进行判决,并统计各自的正确率;3)比较各种
数字的正确率,并对结果进行分析:4)比较三种方法的正确率,并对结果进行 分析 实验性质:验证性 实验学时:4 实验目的与要求:熟悉判决分析的基本过程,掌握各种距离的计算方法、熟练掌 握各种分类器的训练和预测的MATLAB函数的使用,会对实验结果进行简单的分 析 实验条件:Windows Xp及以上操作系统,MATLAB2O12 研究与思考:有没有描述手写数字的其它指标向量或特征向量?尝试别的特征向 量并分析结果。 实验项目六 实验名称:神经网络与应用 实验内容:对于实验项目五的内容,1)采用前馈神经网络对训练数据进行训练: 2)尝试改变隐层节点个数,并用验证集进行验证,找出最好的隐层节点数:3) 用测试数据进行测试,并对结果进行分析 实验性质:验证性 实验学时:2 实验目的与要求:熟练掌握前馈神经网络的训练和顶测的MATLAB函数的使用方 法和参数的意义,熟悉利用神经网络进行判决分析的过程。 实验条件:Windows Xp及以上操作系统,MATLAB2012 研究与思考:通过实验,隐节点个数对结果的影响如何? 实验项目七 实验名称:聚类分析实验 实验内容:给定2014年我国城镇居民分地区人均可支配收入来源数据,①计算 各样品间的欧氏距离。马氏距离和加权评分距离:②运用谱系聚类法聚类,包括 确定最优聚类数, 选择合适的类间距离,同时做出谱系图:③运用K均值聚类法
数字的正确率,并对结果进行分析;4)比较三种方法的正确率,并对结果进行 分析 实验性质:验证性 实验学时:4 实验目的与要求:熟悉判决分析的基本过程,掌握各种距离的计算方法、熟练掌 握各种分类器的训练和预测的 MATLAB 函数的使用,会对实验结果进行简单的分 析。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:有没有描述手写数字的其它指标向量或特征向量?尝试别的特征向 量并分析结果。 实验项目六 实验名称:神经网络与应用 实验内容:对于实验项目五的内容,1)采用前馈神经网络对训练数据进行训练; 2)尝试改变隐层节点个数,并用验证集进行验证,找出最好的隐层节点数;3) 用测试数据进行测试,并对结果进行分析 实验性质:验证性 实验学时:2 实验目的与要求:熟练掌握前馈神经网络的训练和预测的 MATLAB 函数的使用方 法和参数的意义,熟悉利用神经网络进行判决分析的过程。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:通过实验,隐节点个数对结果的影响如何? 实验项目七 实验名称:聚类分析实验 实验内容:给定 2014 年我国城镇居民分地区人均可支配收入来源数据,①计算 各样品间的欧氏距离。马氏距离和加权评分距离;②运用谱系聚类法聚类,包括 确定最优聚类数,选择合适的类间距离,同时做出谱系图;③运用 K 均值聚类法
进行聚类,并建立最佳聚类数公式:④运用C模糊均值聚类,并建立最佳聚类数 公式: 实验性质:验证性 实验学时:2 实验目的与要求:掌握利用MTLB计算谱系聚类与K均值聚类的函数:掌握模 糊C均值聚类与模糊减法聚类的MATLAB实现:掌握最优聚类数的理论及其实现。 实验条件:Windows Xp及以上操作系统,MATLAB2OI2 研究与思考:综合分析以上不同聚类法所取得的聚类结果,能得到什么结论。 四、考核方式 考查 五、推荐实验教材和教学参考书 实验教材:吴礼斌,李柏年,MATLAB数据分析方法(第2版),机械工业出版社, 2017.2. 六、其他需说明的 大纲修订人:杨志华 修订日期:2020.12.19. 大纲审定者:许波 审定日期:2022年1月
进行聚类,并建立最佳聚类数公式;④运用 C 模糊均值聚类,并建立最佳聚类数 公式; 实验性质:验证性 实验学时:2 实验目的与要求:掌握利用 MATLAB 计算谱系聚类与 K 均值聚类的函数;掌握模 糊 C 均值聚类与模糊减法聚类的 MATLAB 实现;掌握最优聚类数的理论及其实现。 实验条件:Windows Xp 及以上操作系统,MATLAB 2012 研究与思考:综合分析以上不同聚类法所取得的聚类结果,能得到什么结论。 四、考核方式 考查 五、推荐实验教材和教学参考书 实验教材:吴礼斌,李柏年, MATLAB 数据分析方法(第 2 版),机械工业出版社, 2017.2. 六、其他需说明的 大纲修订人: 杨志华 修订日期: 2020.12.19. 大纲审定者: 许波 审定日期: 2022 年 1 月