《统计学习》课程教学大纲 课程基本信息(Course Information) 课程代码 学时 (CourseC MATH 3712 (Credit 48 学纷 Hours) (Credits) 课程名称 (中文)统计学习 (Course Name) (英文)Statistical Leaming 课程类型 专业方向选修、部分工科、部分金融、管院专业选修课 (CourseType 授课对家 本科生 (Target Audience) (Undergraduate) 授课语言 (Language of 中文 (Chinese) Instruction) “开课院系 数学科学学院 微积分,线性代数, 先修课程 概率统计(Calculus.」后续课程 (Prerequisite)Linear Algebra (post)) Probability-Statistics) 课程网址 课程负素人 张耀字刷教授 (Course建设中 (Instructor) 〔中文30-500字,含课程性质、主要教学内容、课程教学目标等) 本门课主要讲授统计学习基础理论和现代机器学习算法。本课程立足于科学和 工程研究中数据极速增长和计算能力指数增强的时代背景,向学生介绍如何 计高效的机器算法,从海量数据中获得可靠的知识、发现新规律、建立新模型 课程简介(中从而推动科学和工程难题的解决。教学内容既包括理论完善的基础算法,如 文) 性方法、核方法等,也包括当前应用中最重要的基于深度神经网络的算法。本 (Description))会从机器学习的基本概念入门,用一些简单的例子从实践到理论带学生入 机器学习,打牢数学基础。在深度学习的授课中,本课程不但关注算法实我 更会重点关注学生对方法的理论理解以及对科学与工程应用场景的认识。在整 门课的学习过程中,需要学生动手编程完成算法的实现,并解决中等规模的 题。在理论方面,本门课要求学生掌握基本的理论分析能力。对实际问题中可 能出现的情况做出基本的理论判断,并能针对数据和向题的特性选用合适的方
《统计学习》课程教学大纲 课程基本信息(Course Information) 课程代码 (Course Code) MATH 3712 *学时 (Credit Hours) 48 *学分 (Credits) 3 *课程名称 (Course Name) (中文)统计学习 (英文)Statistical Learning 课程类型 (Course Type) 专业方向选修、部分工科、部分金融、管院专业选修课 授课对象 (Target Audience) 本科生 (Undergraduate) 授课语言 (Language of Instruction) 中文 (Chinese) *开课院系 (School) 数学科学学院 先修课程 (Prerequisite) 微积分, 线性代数, 概率统计 ( Calculus, Linear Algebra, Probability-Statistics) 后续课程 (post) 无 *课程负责人 (Instructor) 张耀宇 副教授 课程网址 (Course Webpage) 建设中 *课程简介(中 文) (Description) (中文 300-500 字,含课程性质、主要教学内容、课程教学目标等) 本门课主要讲授统计学习基础理论和现代机器学习算法。本课程立足于科学和 工程研究中数据极速增长和计算能力指数增强的时代背景,向学生介绍如何设 计高效的机器算法,从海量数据中获得可靠的知识、发现新规律、建立新模型, 从而推动科学和工程难题的解决。教学内容既包括理论完善的基础算法,如线 性方法、核方法等,也包括当前应用中最重要的基于深度神经网络的算法。本 课会从机器学习的基本概念入门,用一些简单的例子从实践到理论带学生入门 机器学习,打牢数学基础。在深度学习的授课中,本课程不但关注算法实践, 更会重点关注学生对方法的理论理解以及对科学与工程应用场景的认识。在整 门课的学习过程中,需要学生动手编程完成算法的实现,并解决中等规模的问 题。在理论方面,本门课要求学生掌握基本的理论分析能力。对实际问题中可 能出现的情况做出基本的理论判断,并能针对数据和问题的特性选用合适的方
英文300-500字) leaming methods.Based on current era of big data,in which data from scientific and engincerir research grow exponentially.this course will teach students about how to design efficient machine learning algorithms to extract reliable knowledge.discover new laws.establish new meomtondithwell-stabs 课程简介(英from basic concepts of machine learning.guiding students from practice to theory with simpl 文) xamples,helping them establish solid mathematical understanding Apart from practice of (Description)aorithms,it emphasizes morenunderstanding the theory of algorithms and their applicationt ntific and engineering problems.During the should get hands oncodingof Students should als e the ability of alyzing the algorithms n problemsand esin propermetho asedon the feature of target data and problems. 课程目标与内容(Course objectives and contents) 1.扎实掌握经典统计学习算法和背后的数学理论。(B1) “课程目标 2.掌握以深度学习为代表的现代机器学习算法,并能编程实现。(B4 3,学会用数据驱动和模型结合的统计方法解决计算问题。(B2) 4.理解统计机器学习对重大科学问题和国家重大工程需求的重要价值。(3 “敦学内容进度 作业及老 果程思政融 安排及对应课 章节教学纳容(要点) 学时 教学形式 核要求 点 标 程目标(C1as Schedule Requirements Course 高维空间、维数灾难 书面作业理解机器学习 2,A3 和蒙特卡洛 课堂教学 1次:掌对我国未来转 机器学习厘、发展、以
法。 *课程简介(英 文) (Description) (英文 300-500 字) This course focuses on the theoretical foundation of statistical learning and the modern machine learning methods. Based on current era of big data, in which data from scientific and engineering research grow exponentially, this course will teach students about how to design efficient machine learning algorithms to extract reliable knowledge, discover new laws, establish new models from big data. It not only includes conventional algorithms with well-established theory, but also includes deep learning as the most important algorithm in modern applications. It starts from basic concepts of machine learning, guiding students from practice to theory with simple examples, helping them establish solid mathematical understanding. Apart from practice of algorithms, it emphasizes more on understanding the theory of algorithms and their application to scientific and engineering problems. During the course, students should get hands on coding of the algorithms and solve medium-size problems. Students should also acquire the ability of analyzing the algorithms theoretically in presence of real problems and design proper method based on the feature of target data and problems. 课程目标与内容(Course objectives and contents) *课程目标 (Course Object) 1.扎实掌握经典统计学习算法和背后的数学理论。(B1) 2.掌握以深度学习为代表的现代机器学习算法,并能编程实现。(B4) 3.学会用数据驱动和模型结合的统计方法解决计算问题。(B2) 4.理解统计机器学习对重大科学问题和国家重大工程需求的重要价值。(A3) *教学内容进度 安排及对应课 程目标 (Class Schedule & Requirements & Course Objectives) 章节 教学内容(要点) 学时 教学形式 作业及考 核要求 课程思政融入 点 对应课程目 标 第 一 章 高维空间、维数灾难 和蒙特卡洛 3 课堂教学 书面作业 1 次;掌握 机器学习 理解机器学习 对我国未来转 型、发展、以 B2, A3
的应用背及解决卡脖子 景和基本计筒问的重 要意义,帮助 学生树立解法 重大科学和厅 程问题的志向 书面作业 2次,证明 高维空间 第二 的一些基培养学生扎实 线性横型 果堂教学 本性质,以的数学功底 及蒙特制 洛的收 阶。 书面作业 次证明 极大似名 和最小三 第三核模 程的等价培养学生扎实 课堂教学 关系,证明的数学功底 过参数化 下的 等价性定 理 书面作业 2次,证明 第四深度神经网络及其 课堂教学 核回归和培养学生扎实 理论 分类方法的数学功底 的一类性 书面作业 次,推 反向传授 及其他性 培养学生扎实 第五 非监督学习 质:编程作 课堂教学 业1次使的 程n法B4 更功底 做MNIS 图像分类 井作分析】 书面作业 第六 课堂教学 一次,证明 培养学生扎实 强化学习 旧的身法和理 B1,B4 PCA和 k-means笥 功底
的应用背 景和基本 概念 及解决卡脖子 计算问题的重 要意义,帮助 学生树立解决 重大科学和工 程问题的志向 第 二 章 线性模型 6 课堂教学 书面作业 2 次,证明 高维空间 的一些基 本性质,以 及蒙特卡 洛的收敛 阶。 培养学生扎实 的数学功底 B1 第 三 章 核模型 6 课堂教学 书面作业 2 次,证明 极大似然 和最小二 程的等价 关系,证明 过参数化 下的一些 等价性定 理 培养学生扎实 的数学功底 B1 第 四 章 深度神经网络及其 理论 6 课堂教学 书面作业 2 次,证明 核回归和 分类方法 的一类性 质 培养学生扎实 的数学功底 B1 第 五 章 非监督学习 6 课堂教学 书面作业 1 次,推导 反向传播 及其他性 质;编程作 业 1 次,使 用 pytorch 做 MNIST 图像分类, 并作分析。 培养学生扎实 的编程和算法 功底 B4 第 六 章 强化学习 6 课堂教学 书面作业 一次,证明 PCA 和 k-means 算 培养学生扎实 的算法和理论 功底 B1, B4
法的性质 编程 次,比 不同降绀 简法在实 数据上 的效果 书面作业 一次,推导 贝尔曼方 第章 七机器学习和神经科 程:编程培养学生扎实 果堂教学 业一次, 的 法和理 ,B4 写pytorch功底 代码实现 深度强化 书面作业 一次比较 深度神经 网络和直 机器学习理论前沿 培养学生学 第八 其在科学计算中 课堂牧学 实神经 见2,B4 网络的 的应用前沿 同:编程作 业一次, 拟神经元 网络 书面作业 一次,深入 了解我国激发学生勇 面对的一探索学科前 第 个卡脖子沿。敢于解决 课堂教学 科学或 2,A3 程问题,闸需求问题的科 述机器学学家精神与家 习算法可国情怀 能发挥的 作用。 注1:建议按照教学周周学时编排。 注2:相应章节的课程思政融入点根据实际情况填写
法的性质; 编程作业 一次,比较 不同降维 算法在实 际数据上 的效果 第 七 章 机器学习和神经科 学 6 课堂教学 书面作业 一次,推导 贝尔曼方 程;编程作 业一次,编 写 pytorch 代码实现 深度强化 学习 培养学生扎实 的算法和理论 功底 B1, B4 第 八 章 机器学习理论前沿 和其在科学计算中 的应用前沿 6 课堂教学 书面作业 一次,比较 深度神经 网络和真 实神经元 网络的异 同;编程作 业一次,模 拟神经元 网络。 培养学生学科 交叉的广阔视 野 B2, B4 第 九 章 3 课堂教学 书面作业 一次,深入 了解我国 面对的一 个卡脖子 科学或工 程问题,阐 述机器学 习算法可 能发挥的 作用。 激发学生勇于 探索学科前 沿、敢于解决 国家重大战略 需求问题的科 学家精神与家 国情怀 B2, A3 注 1:建议按照教学周周学时编排。 注 2:相应章节的课程思政融入点根据实际情况填写
*考核方式 (1)平时作业20分 (2)课程项目30分 (Grading) (3)期末考试50分 1.Foundations of Data Science,Avrim Blum,John Hopcroft, Ravindran Kannan *教材或参考资 Cambridge University Press 2020,9781108755528 料(Textbooks 2.机器学习周志华清华大学2016-1-1 &Other 3. 深度学习作者:伊恩·古德费洛/[加约书亚·本吉奥/[加]亚伦库维尔。 Materials) 译者:译者:赵申剑/黎彧君/符天凡/李凯人民邮电出版社712017 其它(More) 备注(Notes) 备注说明: 1.带*内容为必填项。 2.课程简介字数为300-500字;课程大纲以表述清楚教学安排为宜,字数不限
*考核方式 (Grading) (1)平时作业 20 分 (2)课程项目 30 分 (3)期末考试 50 分 *教材或参考资 料 (Textbooks & Other Materials) 1. Foundations of Data Science, Avrim Blum, John Hopcroft, Ravindran Kannan, Cambridge University Press 2020, 9781108755528 2. 机器学习 周志华 清华大学 2016-1-1 3. 深度学习 作者:伊恩·古德费洛 / [加] 约书亚·本吉奥 / [加] 亚伦·库维尔。 译者:译者: 赵申剑 / 黎彧君 / 符天凡 / 李凯 人民邮电出版社 7/1/2017 其它(More) 备注(Notes) 备注说明: 1.带*内容为必填项。 2.课程简介字数为 300-500 字;课程大纲以表述清楚教学安排为宜,字数不限