《大数据分析》课程教学大纲 课程基本信息(Course Information) 课程代码 学时 MATH3708 48 学纷 3 (CourseC Hours) (Credits) 课程名称 (中文)大数据分析 (Course Name) (英文)Big Data Analysis 课程类型 专业方向选修课、部分工科、部分金融、管院专业选修课 (Course Type) 授课对家 (Target 本科生 Audience) 授课语言 (Language of 全中文 Instruction) “开课院系 数学科学学院 (School) 先修课程微积分、线性代数、概率后续课程 (Prerequisite)统计 (nost) “课程负责人 课程网址 (Course (Instructor) Webpage) 本课程采用易于处理的生活和壮会科学中的许多实例作为引例,主要介绍大数据分析中 “课程简介(中 理论与方法,包括由输入,输出、分析、实验设计及编程组成的五步建模法。通过本课程 的学习,学生将对大数据分析的价值、意义和基本原理建立清张和比较全面的认识,掌握 文) 有关数据发掘、处理、建模和解程的基本原理和方法,了解和熟悉大数据分析在社会科学 (Des 研充。商业分析和公共管理等领域的实际案.我们的目标是给学生对感兴或重委要 的大数据问题解决方法设计留下更多的创新空间。 Big Data Analytics isa undergraduate level course mainly designed for students with social sciences and management background.The objective of the course to give students a broad overview of the basic principles and applications of data nalytics Students will also be familiar with the various aspects of data analvtics 课程简介(英 ) uch managing modeling and (Description) social science research,business analysis and public management.Our goal is to provide students with more space for innovation in the design of big data analysis methods for various areas of interest or important complex problems by applying the problems in the real word,which is an important ability for the
《大数据分析》课程教学大纲 课程基本信息(Course Information) 课程代码 (Course Code) MATH3708 *学时 (Credit Hours) 48 *学分 (Credits) 3 *课程名称 (Course Name) (中文) 大数据分析 (英文) Big Data Analysis 课程类型 (Course Type) 专业方向选修课、部分工科、部分金融、管院专业选修课 授课对象 (Target Audience) 本科生 授课语言 (Language of Instruction) 全中文 *开课院系 (School) 数学科学学院 先修课程 (Prerequisite) 微积分、线性代数、概率 统计 后续课程 (post) *课程负责人 (Instructor) 林一青 课程网址 (Course Webpage) *课程简介(中 文) (Description) 本课程采用易于处理的生活和社会科学中的许多实例作为引例,主要介绍大数据分析中的 理论与方法,包括由输入、输出、分析、实验设计及编程组成的五步建模法。通过本课程 的学习,学生将对大数据分析的价值、意义和基本原理建立清晰和比较全面的认识,掌握 有关数据发掘、处理、建模和解释的基本原理和方法,了解和熟悉大数据分析在社会科学 研究、商业分析和公共管理等领域的实际案例。我们的目标是给学生对感兴趣或重要复杂 的大数据问题解决方法设计留下更多的创新空间。 *课程简介(英 文) (Description) Big Data Analytics is a undergraduate level course mainly designed for students with social sciences and management background. The objective of the course to give students a broad overview of the basic principles and applications of data analytics. Students will also be familiar with the various aspects of data analytics such as exploring, managing, modeling and interpreting data. Students’ learning will also be enhanced by their exposure to real life applications of data analytics in social science research, business analysis and public management. Our goal is to provide students with more space for innovation in the design of big data analysis methods for various areas of interest or important complex problems by applying them to solve the problems in the real word, which is an important ability for the
undergraduate students 课程目标与内容(Course objectives and contents) 1.针对大数据如何组织、建模、分析、预测、分类以及发现异常点和内在关 *课程目标 联关系。 (B1,B2) 2.学会大数据分析中的一般理论、建模方法和实验设计编程方法。(B4) (Course Object) 3.通过阅读完成大作业,学会初步撰写论文的能力。为理工科各专业学生进 一步开创性研究打下基础。(B3) 章节教学内容(要点) 学时 敢学形式 作业及考课程思政融入对应课程目 核要求 点 标 示 伪什么要学习大 上网查 数据分析和R语 阅大数 言?什么是大数 据分析?大数指 据分析 分析解决问题的 新动向。 培养学生钻6 思路?大数据分 讲授与上机相写出阅 精神,一丝不 2 析能解决什么问 结合 读新知 简、认真严谨 教学内容讲电 县的新 的工作作风 题?大数据分析 安排及对应课 有哪些典型的 体会并 程目标(Clas 用?R语言入 交 Schedule& 需要知道什么? Requirements 安装R语 Course Obiectives) R语言快速入门:什 1:数据 么是R包?如何战 的基 培养学生钻杨 得R包:R如何托 处理。 步;R的基本操作: 6 讲授与上机相 精神,一丝不 哈). R的数据对象 结合 R的 简、认真严谨 作图功能:R的程 设计 还原为 原始数 据 大数据的直观印家 三如何获得数据分 特征的直观印象:如 6 一丝 结合 赔数据简、认真严谨 2 何获得变量间的相 的异常的工作作风
undergraduate students. 课程目标与内容(Course objectives and contents) *课程目标 (Course Object) 1. 针对大数据如何组织、建模、分析、预测、分类以及发现异常点和内在关 联关系。(B1, B2) 2. 学会大数据分析中的一般理论、建模方法和实验设计编程方法。(B4) 3. 通过阅读完成大作业,学会初步撰写论文的能力。为理工科各专业学生进 一步开创性研究打下基础。(B3) *教学内容进度 安排及对应课 程目标 (Class Schedule & Requirements & Course Objectives) 章节 教学内容(要点) 学时 教学形式 作业及考 核要求 课程思政融入 点 对应课程目 标 示例: 第一 章 为什么要学习大 数据分析和 R 语 言?什么是大数 据分析?大数据 分析解决问题的 思路?大数据分 析能解决什么问 题?大数据分析 有哪些典型的应 用?R 语言入门 需要知道什么? 3 讲授与上机相 结合 上网查 阅大数 据分析 新动向。 写出阅 读新知 识的新 体会并 交读书 报告 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2 第 二 章 R 语言快速入门:什 么是 R 包?如何获 得 R 包;R 如何起 步;R 的基本操作; R 的数据对象;R 的 作图功能;R 的程序 设计 6 讲授与上机相 结合 安装 R 语 言。实验 1:数据 的基本 处理。 实验 2: 何将汇 总数据 还原为 原始数 据 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2 第 三 章 大数据的直观印象; 如何获得数据分布 特征的直观印象;如 何获得变量间的相 6 讲授与上机相 结合 实验 3: 车险理 赔数据 的异常 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2
关性直观印象:如何 获得S数据的直 观印象:如何获得彩 淘行 宝 本词频数据的直观 印象 数有 性 实验 5: 府工 作报告 有哪 数据? 实验6: 天猫成 的分类 预测。 实验7 提炼不 同消费 基于各类回归的分 类预测:回归分析 行为网 培养学生钻研 第四法k近邻法决第 讲授与上机相客的主 情神,一丝不 要行为。 树法、神经网络方 结合 简、认真严谨 实验8: 的工作作风 法,支持向量机方法 精准预 态势。 实验9: 天猫成 交顾 的预测 实验10: 环境污 常规聚类与特色影 垫的风 类:k-Means聚类 域划分 五层次聚类.EM聚 讲授与上机相实验11 精神, 类.BIRCH聚类。 结合 不同岗 简、认真严道 2 SOM网络聚类 位培训 的工作作风 DBSCAN聚类等 的比较。 实哈12 手写邮
关性直观印象;如何 获得 GIS 数据的直 观印象;如何获得文 本词频数据的直观 印象 分析。 实验 4: 淘宝各 行业商 品成交 指数有 相关性 吗? 实验 5: 政府工 作报告 中有哪 些高频 数据? 第 四 章 基于各类回归的分 类预测:回归分析 法、k-近邻法、决策 树法、神经网络方 法、支持向量机方法 12 讲授与上机相 结合 实验 6: 天猫成 交顾客 的分类 预测。 实验 7: 提炼不 同消费 行为顾 客的主 要行为。 实验 8: 精准预 测股票 市场的 态势。 实验 9: 天猫成 交顾客 的预测 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2 第 五 章 常规聚类与特色聚 类:k-Means 聚类、 层次聚类、EM 聚 类。BIRCH 聚类、 SOM 网络聚类、 DBSCAN 聚类等 12 讲授与上机相 结合 实验 10: 环境污 染的区 域划分。 实验 11: 不同岗 位培训 的比较。 实验 12: 手写邮 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2
政编码 的识别 实验13: 酒品 的甄 14: 超市商 品推 系统设 金融 发现大数据中的内 络、传染 在关联性:复杂网络 病网络、培养学生钻研 第六 方法:Apriori算法: 授与上机相居影响网结神 6 一丝不 结合 算法: 算等 的工作作风 等的润 现问题、 同步性 题及 络的 问题探 发现大数据中的离 鲜数据点:诊断异: 实验16: 培养学生钻研 数据的榄式瓶别:朴 第七 索贝叶斯方 3 饼授与上机相 信用 精神,一丝不 欺诈军 2 结合 法:Logistic回归方 别系统 简认真严谨 法:DR方法:LOF 设计 工作作风 方法等 培养学生盐研 考试 大作业交流 讲授与上机相 精神,一丝不 周 结合 ,2,3 注1:建议按照敦学周周学时绵排。 注2:相应章节的课程思政融入点根据实际情况填写。 考核方式 2时作业(20%)+大作业(10%) +期末考试(70% (Grading)
政编码 的识别。 实验 13: 红酒品 质的甄 别 第 六 章 发现大数据中的内 在关联性:复杂网络 方法;Apriori 算法; Eclat 算法;SPADE 算等 6 讲授与上机相 结合 实验 14: 超市商 品推荐 系统设 计。 实验 15: 金融网 络、传染 病网络、 影响网 络、生物 学网络 等的涌 现问题、 同步性 问题及 网络的 脆弱性 问题探 讨 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2 第 七 章 发现大数据中的离 群数据点:诊断异常 数据的模式甄别;朴 素贝叶斯方 法;Logistic 回归方 法;DR 方法;LOF 方法等 3 讲授与上机相 结合 实验 16: 信用卡 欺诈甄 别系统 设计 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2 考 试 周 大作业交流 3 讲授与上机相 结合 培养学生钻研 精神,一丝不 苟、认真严谨 的工作作风 1,2,3 注 1:建议按照教学周周学时编排。 注 2:相应章节的课程思政融入点根据实际情况填写。 *考核方式 (Grading) 平时作业(20%)+大作业(10%)+期末考试(70%)
*教材或参考资 1)肖柳青周石鹏,随机模拟方法与应用,北京大学出版社,2014.9 料(Textbooks [2!肖柳青周石鹏,统计计算与机器学习,北京大学出版社,(待出版) &Other Materials) 其它(More) 备注(Notes) 备注说明: 1.带*内容为必填项。 2.课程简介字数为300-500字;课程大纲以表述清楚教学安排为宜,字数不限
*教材或参考资 料 (Textbooks & Other Materials) [1] 肖柳青 周石鹏,随机模拟方法与应用,北京大学出版社,2014.9 [2] 肖柳青 周石鹏,统计计算与机器学习,北京大学出版社,(待出版) 其它(More) 备注(Notes) 备注说明: 1.带*内容为必填项。 2.课程简介字数为 300-500 字;课程大纲以表述清楚教学安排为宜,字数不限