
“大数据技术”课程教学大纲 第一部分 大纲说明 一、课程性质 《大数据技术》是计算机信息管理专业(专科)一门非统设,选修,省开课程, 课程共计4学分,72学时,第3学期开设。本课程系统介绍了大数据相关知识, 共有12章,系统地讲授大数据的基本概念、大数据处理架构Hadoop、分布式文 件系统HDFS、分布式数据库HBse、NoSQL数据库、云数据库、分布式并行编 程模型MapReduce,数据可视化以及大数据在互联网,生物医学和物流等各个领 域的应用.在Hadoop、HDFS、HBase和MapReduce等重要章节,安挂了入门 级的实践操作,让学生更好地学习和章程大数据关键技术。 二、教学目的 本课程作为大数据技术的入门课程,为学生搭建起通向“大数据知识空间“ 的桥梁和纽带,以“构建知识体系、闻明基本原理、,引导初级实践、了解相关应 用为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。 三、教学目标 (一)知识日标 1.了解大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算 模式和产业发展: 2.了解云计算、物联网的概念及其与大数据之间的紧密关系: 3,了解adoop的发展历史,重要特性和应用现状,adoop项目结构及其各 个组件: 4,了解分布式文件系统的基本概念、结构和设计需求
“大数据技术”课程教学大纲 第一部分 大纲说明 一、课程性质 《大数据技术》是计算机信息管理专业(专科)一门非统设,选修,省开课程, 课程共计 4 学分,72 学时,第 3 学期开设。本课程系统介绍了大数据相关知识, 共有 12 章,系统地讲授大数据的基本概念、大数据处理架构 Hadoop、分布式文 件系统 HDFS、分布式数据库 HBase、NoSQL 数据库、云数据库、分布式并行编 程模型 MapReduce、数据可视化以及大数据在互联网、生物医学和物流等各个领 域的应用。在 Hadoop、HDFS、HBase 和 MapReduce 等重要章节,安排了入门 级的实践操作,让学生更好地学习和掌握大数据关键技术。 二、教学目的 本课程作为大数据技术的入门课程,为学生搭建起通向“大数据知识空间” 的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应 用”为原则,为学生在大数据领域“深耕细作”奠定基础、指明方向。 三、教学目标 (一)知识目标 1.了解大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算 模式和产业发展; 2.了解云计算、物联网的概念及其与大数据之间的紧密关系; 3.了解 Hadoop 的发展历史、重要特性和应用现状,Hadoop 项目结构及其各 个组件; 4.了解分布式文件系统的基本概念、结构和设计需求;

5.掌捏dp分布式文件系统HDFS的重要概念、体系结构、存储原理和读 写过程: 6.了解分布式数据库旧a5e的访问接口、数据模型、实现原理和运行机制, 并然练掌握旧ase的使用方法: 7.了解NoSQL数据库与传统的关系数据库的差异,NoSQL数据库的四大类型 以及NoSQL数据库的三大基石: 8.了解云数据库的概念、基本原理和代表性产品的使用方法 9,了解大数据在互联网等领域的典型应用。 (二)技能目标 1,能够建立对大数据知识体系的轮扉性认识: 2.能够熟练掌握do0p平台的安装和使用方法: 3.能够熟练掌握分布式文件系统DS的使用方法: 4,能够基本掌握Redis、ongB等NoSQL数据库的使用方法: 5.能够熟族掌捏分布式编程框架MapReduce的基本原理和编程方法: 8能够了解数据可视化的概念和相关工具: (三)素养目标 1以习近平新时代中国特色社会主义思想为指导,坚持知识传授与价值引领 相结合,运用可以培养大学生理想信念、价值取向、政治信仰、社会责任的题材 与内容,全面提高大学生缘事析理、明辨是非的能力。 2.增加学生“四个自信”,通过课程思政全面有人,让学生坚定“道路自信、 理论自信、制度自信、文化自信”的信念。从“做中学,学中做”,实践出真理, 践行“富强、民主、文明、和谐、自由、平等、公正、法治、爱国、数业、诚信
5.掌握 Hadoop 分布式文件系统 HDFS 的重要概念、体系结构、存储原理和读 写过程; 6.了解分布式数据库 HBase 的访问接口、数据模型、实现原理和运行机制, 并熟练掌握 HBase 的使用方法; 7.了解 NoSQL 数据库与传统的关系数据库的差异、NoSQL 数据库的四大类型 以及 NoSQL 数据库的三大基石; 8.了解云数据库的概念、基本原理和代表性产品的使用方法; 9.了解大数据在互联网等领域的典型应用。 (二)技能目标 1.能够建立对大数据知识体系的轮廓性认识; 2.能够熟练掌握 Hadoop 平台的安装和使用方法; 3.能够熟练掌握分布式文件系统 HDFS 的使用方法; 4.能够基本掌握 Redis、MongoDB 等 NoSQL 数据库的使用方法; 5.能够熟练掌握分布式编程框架 MapReduce 的基本原理和编程方法; 6.能够了解数据可视化的概念和相关工具; (三)素养目标 1.以习近平新时代中国特色社会主义思想为指导,坚持知识传授与价值引领 相结合,运用可以培养大学生理想信念、价值取向、政治信仰、社会责任的题材 与内容,全面提高大学生缘事析理、明辨是非的能力。 2.增加学生“四个自信”,通过课程思政全面育人,让学生坚定“道路自信、 理论自信、制度自信、文化自信”的信念。从“做中学,学中做”,实践出真理, 践行“富强、民主、文明、和谐、自由、平等、公正、法治、爱国、敬业、诚信

友善”杜会主义核心价值观。提高学生“四个意识”,增加民族自豪感。重塑工 匠精神,增加就业信心。 3,培养学生具有较好的沟通交流能力和书面表达能力:养成善于思考、深入 研究的自主学习的习惯和良好的编程习惯,培养团队合作精神和创新精神。 四、衔接课程 《大数据技术》的衔接课程是《程序设计基础》、《数据库应用》等。 五、教学方法 建议采取理论教学与实践教学并重的方式开展教学。在理论教学中,注重案 例教学和多媒体辅助教学,通过多媒体课件的设计,充分积累课程资源,有效拓 展课堂信息量,适当增加课程的趣味性,努力激发学习兴趣和主动性,切实提高 本课程的学习效果。在实践教学中,注重真案真做,实践内容与工作实际紧密结 合,增强解决实际问题的能力,并增加对行业及岗位实际的认识。 六、教学中应注意的问题 《大数据技术》是一门实践性很强的课。本课程在Hadoop、HDFS、HBase 和MapReduce等重要章节,安排了入门级的实我操作,让学生更好地学习和掌 握大数据关键技术。 在每一章教学内容之后应给出教学要求,大体分为三个层次:了解、草握和 熟练拿醒。它们的含义大致为:了解就是掌握概念,拿握就是能够理解和分析现 有知识,熟练掌握就是会运用所学知识解决实际问题。 第二部分多媒体教材情况 一、教材介绍
友善”社会主义核心价值观。提高学生“四个意识”,增加民族自豪感。重塑工 匠精神,增加就业信心。 3.培养学生具有较好的沟通交流能力和书面表达能力;养成善于思考、深入 研究的自主学习的习惯和良好的编程习惯,培养团队合作精神和创新精神。 四、衔接课程 《大数据技术》的衔接课程是《程序设计基础》、《数据库应用》等。 五、教学方法 建议采取理论教学与实践教学并重的方式开展教学。在理论教学中,注重案 例教学和多媒体辅助教学。通过多媒体课件的设计,充分积累课程资源,有效拓 展课堂信息量,适当增加课程的趣味性,努力激发学习兴趣和主动性,切实提高 本课程的学习效果。在实践教学中,注重真案真做,实践内容与工作实际紧密结 合,增强解决实际问题的能力,并增加对行业及岗位实际的认识。 六、教学中应注意的问题 《大数据技术》是一门实践性很强的课。 本课程在 Hadoop、HDFS、HBase 和 MapReduce 等重要章节,安排了入门级的实践操作,让学生更好地学习和掌 握大数据关键技术。 在每一章教学内容之后应给出教学要求,大体分为三个层次:了解、掌握和 熟练掌握。它们的含义大致为:了解就是掌握概念,掌握就是能够理解和分析现 有知识,熟练掌握就是会运用所学知识解决实际问题。 第二部分 多媒体教材情况 一、教材介绍

数材名称为《大数据技术原理与应用(第3版)》(978-7-115-54405-6),林 子雨编著,人民p电出版社,2021年1月第3版。文字教材是学生学习裸程的 主要用书,是学生获得知识和能力的基本蝶体,是教和学的根本依据。 本教材是国内高校第一本系统介绍大数据知识专业教材:工信部“全国云 计算与大数据应用技术人才考试、认证项目”目前唯一指定大数据教材, 二、资源介绍 本课程在国开学习网(http://w,o阳chn.cn/)上传教学大钢、课程实施 方案、电子教案等配套教学资源,为教师教学和学生学习大数据课程,提供全方 位、一站式服务。所有教学资源支持电脑和手机浏览。 三、课时分配及进度安排建议 本课程共72学时,4学分,其中实验学时为8学时。具体学时分配如下表 所示: 表】课时分配及进度安排表 课 适用专业:计算机信息管理 课程 省开 性质 层 专科 计划总 学时数 72 主要教学内容 教学活动(学时) 面授 实验 介绍大数据的基本概念和应用领域, 2 并阐述大数据、云计算和物联网的相 互美系 介绍大数据处理架构Hadoop 4 分布式文件系统HDFS的基本原理和 6 使用方法 分布式数据库HBas的基本原理和使 6 用方法 NoSQL数据库的概念和基本原理 4 4
教材名称为《大数据技术原理与应用(第 3 版)》(978-7-115-54405-6),林 子雨编著,人民邮电出版社,2021 年 1 月第 3 版。文字教材是学生学习课程的 主要用书,是学生获得知识和能力的基本媒体,是教和学的根本依据。 本教材是国内高校第一本系统介绍大数据知识专业教材;工信部“全国云 计算与大数据应用技术人才考试、认证项目”目前唯一指定大数据教材。 二、资源介绍 本课程在国开学习网(http://www.ouchn.cn/)上传教学大纲、课程实施 方案、电子教案等配套教学资源,为教师教学和学生学习大数据课程,提供全方 位、一站式服务。所有教学资源支持电脑和手机浏览。 三、课时分配及进度安排建议 本课程共 72 学时,4 学分,其中实验学时为 28 学时。具体学时分配如下表 所示: 表 1 课时分配及进度安排表 适用专业:计算机信息管理 课程 性质 省开 课 程 层 次 专科 计划总 学时数 72 主要教学内容 教学活动(学时) 面授 实验 介绍大数据的基本概念和应用领域, 并阐述大数据、云计算和物联网的相 互关系 2 介绍大数据处理架构 Hadoop 4 4 分布式文件系统 HDFS 的基本原理和 使用方法 6 4 分布式数据库 HBase 的基本原理和使 用方法 6 4 NoSQL 数据库的概念和基本原理 4 4

云数据库 2 4 分布式并行编程模型MapRed uce即 6 理和使用方法 数据仓库Hive的基本原理和使用方 2 法 Spak原理与基础编程 4 数据可视化 大数据应用 2 阴末复习 2 学时小计:44 学时小计:28 第三部分教学内容与教学要求 第1讲大数据概述 教学内容: 1I大数据时代 12大数据概色 13大数据的影响 14大数据的应用 15大数据关键技术 16大数据计算模式 17大数据产业 18大数据与云计算、物联网的关系 教学要求: 能够建立对大数据知识体系的轮廓性认识,了解大数据发展历程、基本概念 主要影响、应用领域、关键技术、计算模式和产业发展,并了解云计算、物联网 的概念及其与大数据之间的紧密关系。 课程思政内容: 本章结合大数据技术在我国的发展历程,融入让学生感知中国的内容,增加 学生的民族自豪感和爱国主义精神。学生初次大数据技术,对学生而言难度较大
云数据库 2 4 分布式并行编程模型 MapReduce 原 理和使用方法 6 6 数据仓库 Hive 的基本原理和使用方 法 2 Spark 原理与基础编程 4 数据可视化 4 大数据应用 2 期末复习 2 学时小计:44 学时小计:28 第三部分 教学内容与教学要求 第 1 讲 大数据概述 教学内容: 1.1 大数据时代 1.2 大数据概念 1.3 大数据的影响 1.4 大数据的应用 1.5 大数据关键技术 1.6 大数据计算模式 1.7 大数据产业 1.8 大数据与云计算、物联网的关系 教学要求: 能够建立对大数据知识体系的轮廓性认识,了解大数据发展历程、基本概念、 主要影响、应用领域、关键技术、计算模式和产业发展,并了解云计算、物联网 的概念及其与大数据之间的紧密关系。 课程思政内容: 本章结合大数据技术在我国的发展历程,融入让学生感知中国的内容,增加 学生的民族自豪感和爱国主义精神。学生初次大数据技术,对学生而言难度较大

此时应给学生讲解什么是工匠精神并介绍一些“大国工匠”的经典案例,以真人 真事感召学生学好自己的专业,做社会有用的技能型人才。 第2讲大数据处理架构Hadoop 教学内容 21概述 22 Hadoop项日结构 23 Hadoop的安装与使用 2.4 Hadoop集带的部署与使用 教学要求: 能够了解Hadoop的发展历史,重要特性和应用现状,Hadoop项目结构及其 各个组件,并熟练掌是Hdop平台的安装和使用方法。 课程思攻内容: 让学生亲自上机操作,将杜会主义核心价值观与课堂实例有机地结合起来, 从而达到潜移默化引导学生学习的日的。 第3讲分布式文件系统HDFS 教学内容: 3.1分布式文件系统 32HDFS简介 33HDFS相关概念 3.4HDFS体系结构 35HDFS存储原理 3.6HDS数据读写过程 3.7HDFS编程实践 教学要求: 能够了解分布式文件系统的基本概念、结构和设计需求,掌捏Hadoop分布 式文件系统HDFS的重要概念、体系结构、存储原理和读写过程,并熟练掌摆分 布式文件系统HDFS的使用方法
此时应给学生讲解什么是工匠精神并介绍一些“大国工匠”的经典案例,以真人 真事感召学生学好自己的专业,做社会有用的技能型人才。 第 2 讲 大数据处理架构 Hadoop 教学内容: 2.1 概述 2.2 Hadoop 项目结构 2.3 Hadoop 的安装与使用 2.4 Hadoop 集群的部署与使用 教学要求: 能够了解 Hadoop 的发展历史、重要特性和应用现状,Hadoop 项目结构及其 各个组件,并熟练掌握 Hadoop 平台的安装和使用方法。 课程思政内容: 让学生亲自上机操作,将社会主义核心价值观与课堂实例有机地结合起来, 从而达到潜移默化引导学生学习的目的。 第 3 讲 分布式文件系统 HDFS 教学内容: 3.1 分布式文件系统 3.2 HDFS 简介 3.3 HDFS 相关概念 3.4 HDFS 体系结构 3.5 HDFS 存储原理 3.6 HDFS 数据读写过程 3.7 HDFS 编程实践 教学要求: 能够了解分布式文件系统的基本概念、结构和设计需求,掌握 Hadoop 分布 式文件系统 HDFS 的重要概念、体系结构、存储原理和读写过程,并熟练掌握分 布式文件系统 HDFS 的使用方法

课程思政内容: 此章增加大数据技术在中国的发展过程的介绍,让学生知道,在中国共产党 的领导下,中国的科学家们刻苦估研、不怕困难,突破层层障调,不断取得新的 科学研究高地,这种吃苦耐劳的科研精神,对学生有很大的学习意义和参考价值。 第4讲分布式数据库HBase 教学内容: 4.1概述 42 HBase访间接口 43 HBase数据模型 44 HBase的实现原理 45 HBase运行机制 4.6HBaC应用方案 4.7HBae编程实践 教学要求: 能够了解分布式数据库HBa5C的访间接口,数据颅型、实现原理和运行机制,并 熟练草暴HBase的使用方法 课程思政内容: “实践是检险真理的唯一标准”,本章主要介绍分布式HBaS,在上机操作 的过程中,让学生进一步领悟到真理的内潮和价值。让学生理论联系实际地处理 问题、解决问题。 第5讲NoSQL数据库 教学内容: 5.1 NoSQL简介 52 NoSOL兴起的原因 53 NoSQL与关系数据库的比较 54 NoSQL.的四大类型
课程思政内容: 此章增加大数据技术在中国的发展过程的介绍,让学生知道,在中国共产党 的领导下,中国的科学家们刻苦钻研、不怕困难,突破层层障碍,不断取得新的 科学研究高地,这种吃苦耐劳的科研精神,对学生有很大的学习意义和参考价值。 第4讲 分布式数据库 HBase 教学内容: 4.1 概述 4.2 HBase 访问接口 4.3 HBase 数据模型 4.4 HBase 的实现原理 4.5 HBase 运行机制 4.6 HBase 应用方案 4.7 HBase 编程实践 教学要求: 能够了解分布式数据库 HBase 的访问接口、数据模型、实现原理和运行机制,并 熟练掌握 HBase 的使用方法。 课程思政内容: “实践是检验真理的唯一标准”,本章主要介绍分布式 HBase,在上机操作 的过程中,让学生进一步领悟到真理的内涵和价值。让学生理论联系实际地处理 问题、解决问题。 第5讲 NoSQL 数据库 教学内容: 5.1 NoSQL 简介 5.2 NoSQL 兴起的原因 5.3 NoSQL 与关系数据库的比较 5.4 NoSQL 的四大类型

55 NoSQL.的三大塘石 5.6从NoSOL.到NewSOL.数据库 5.7文档数据库MongoDB 教学要求: 能够了解NoSOL数据库与传统的关系数据库的差异,NoSQL数据库的四大 类型以及NoSQL数据库的三大基石;基本掌握Redis、MongoDB等NoSQL数 据库的使用方法。 课程思政内容: “实践是检验真理的唯一标准”,本章主要介绍NSQL,让学生理论联系实 际地处理问题、解决问题。 第6讲云数据库 教学内容: 6.1云数据库概述 62云数据库产品 63云数据库系统架构 6.4Ama200AWS和云数据库 65微软云数据库SQLAzure 6.6云数据库实践 教学要求: 能够了解云数据库的概念、基本原理和代表性产品的使用方法。 课程思政内容: 甄选出与本章内容相关的杜会主义核心价值观的案例,让学生从案例中学 习,掌握专业、行业必备技能的同时,潜移默化确定自己的人生观、世界观、价 值观。 第7讲MapReduce 教学内容 7.1概述
5.5 NoSQL 的三大基石 5.6 从 NoSQL 到 NewSQL 数据库 5.7 文档数据库 MongoDB 教学要求: 能够了解 NoSQL 数据库与传统的关系数据库的差异、NoSQL 数据库的四大 类型以及 NoSQL 数据库的三大基石;基本掌握 Redis、MongoDB 等 NoSQL 数 据库的使用方法。 课程思政内容: “实践是检验真理的唯一标准”,本章主要介绍 NoSQL,让学生理论联系实 际地处理问题、解决问题。 第6讲 云数据库 教学内容: 6.1 云数据库概述 6.2 云数据库产品 6.3 云数据库系统架构 6.4 Amazon AWS 和云数据库 6.5 微软云数据库 SQL Azure 6.6 云数据库实践 教学要求: 能够了解云数据库的概念、基本原理和代表性产品的使用方法。 课程思政内容: 甄选出与本章内容相关的社会主义核心价值观的案例,让学生从案例中学 习,掌握专业、行业必备技能的同时,潜移默化确定自己的人生观、世界观、价 值观。 第7讲 MapReduce 教学内容: 7.1 概述

72 MapReduce体系结构 T.3 MapReduce工作逢程 7.4实例分析:WordCount T3 MapReduce的具体应用 T.6 MapReduce编程实践 教学要求: 能够熟练拿握分布式编程框架MapReduce的基木原理和编程方法, 课程思政内容: “实践是检验真理的唯一标准”,本章主要介绍MapReduce,在上机操作的 过程中,让学生进一步领悟到真理的内涵和价值。让学生理论联系实际地处理问 题、解决问题。 第8讲Hadoop架构再探讨 教学内容: &.I Hadoop的优化与发展 82HDFS20的新特性 83新一代资源管理调度框架YARN 84 Hadoop生态系统中具有代表性的功能组件 教学要求: 使够了解Hadoop的优化与发展,HDF20的新特性,并熟练掌握Hadoop 生态系统中具有代表性的功能组件的安装和使用方法。 课程思政内容: 培养学生具有较好的沟通交流能力和书面表达能力, 第9讲数据仓库Hive 教学内容: 91概述 92Hve系统製构 93Hve的应用 9.4 Impala
7.2 MapReduce 体系结构 7.3 MapReduce 工作流程 7.4 实例分析:WordCount 7.5 MapReduce 的具体应用 7.6 MapReduce 编程实践 教学要求: 能够熟练掌握分布式编程框架 MapReduce 的基本原理和编程方法。 课程思政内容: “实践是检验真理的唯一标准”,本章主要介绍 MapReduce,在上机操作的 过程中,让学生进一步领悟到真理的内涵和价值。让学生理论联系实际地处理问 题、解决问题。 第 8 讲 Hadoop 架构再探讨 教学内容: 8.1 Hadoop 的优化与发展 8.2 HDFS2.0 的新特性 8.3 新一代资源管理调度框架 YARN 8.4 Hadoop 生态系统中具有代表性的功能组件 教学要求: 能够了解 Hadoop 的优化与发展,HDFS2.0 的新特性,并熟练掌握 Hadoop 生态系统中具有代表性的功能组件的安装和使用方法。 课程思政内容: 培养学生具有较好的沟通交流能力和书面表达能力。 第 9 讲 数据仓库 Hive 教学内容: 9.1 概述 9.2 Hive 系统架构 9.3 Hive 的应用 9.4 Impala

9.5Hve编程实我 教学要求: 了解Hv©系统架构及工作原理,能够独立完成Hiwe编程实践。 课程思政内容: 可结合H编程技术在我国的应用和发展过程,胞入我国打造人类命运共 同体,确立人类文明走向的新航标的理念,增加学生“四个自信”一一道路自信、 理论自信、制度自信、文化自信。 第10讲Spark 教学内容: 10.1 Spark概述 10.2 Spark生态系统 I0.3 Spark运行架构 10.4 Spark SQL 10.5 Spark的部署和应用方式 I0.6 Spark编程实践 教学要求: 了解Spk生态系统和运行架构:能掌握Sark的部署和应用方式以及Spak 编程实践。 课程思政内容: 让学生理论联系实际地处理问题、解决问题。 第11讲数据可视化 教学内容 11.1可视化概述 11.2可视化工具 11.3可视化典型案例 11.4可视化工具实践
9.5 Hive 编程实践 教学要求: 了解 Hive 系统架构及工作原理,能够独立完成 Hive 编程实践。 课程思政内容: 可结合 Hive 编程技术在我国的应用和发展过程,融入我国打造人类命运共 同体,确立人类文明走向的新航标的理念,增加学生“四个自信”——道路自信、 理论自信、制度自信、文化自信。 第10讲 Spark 教学内容: 10.1 Spark 概述 10.2 Spark 生态系统 10.3 Spark 运行架构 10.4 Spark SQL 10.5 Spark 的部署和应用方式 10.6 Spark 编程实践 教学要求: 了解 Spark 生态系统和运行架构;能掌握 Spark 的部署和应用方式以及 Spark 编程实践。 课程思政内容: 让学生理论联系实际地处理问题、解决问题。 第 11 讲 数据可视化 教学内容: 11.1 可视化概述 11.2 可视化工具 11.3 可视化典型案例 11.4 可视化工具实践