
“大数据技术”课程考核要求 一、有关说明 1,考核对象 国家开放大学开放教育专科计算机信息管理专业学生。 2,启用时间 2021年春季学期. 3.考核目标 考核学生对大数据知识体系的掌握情况,以及对Hadoop、HDFS、HBase和 MapReduce的使用方法的草晁能力. 4.考核依据 本课程考核说明是依据国家开放大学《大数器技术课程教学大钢》、文字教 材《大数据技术原理与应用(第3版)》(林子雨编著,人民邮电出版社,2021年 1月第3版)制定的。本课程考核说明是课程考核命题的基本依据, 二、考核内容及要求 1考核内容 考核内容为木课程学习的主要内容,主要包括:大数据的基本概念、大数 据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase,NoSQL数 据库、云数器库、分布式并行编程模型MapReduce、数据可视化以及大数据在 互联网、生物医学和物流等各个领域的应用 2.考核要求 本考核说明将使用下列术语分别表明几种要求层次: ①掌握:能运用有关知识熟练解决最基本的问题或者能综合运用相关知识 解决有一定难度的问题: ②理解:能运用有关知识解缺一般的问题:
“大数据技术”课程考核要求 一、有关说明 1. 考核对象 国家开放大学开放教育专科计算机信息管理专业学生。 2. 启用时间 2021 年春季学期。 3. 考核目标 考核学生对大数据知识体系的掌握情况,以及对 Hadoop、HDFS、HBase 和 MapReduce 的使用方法的掌握能力。 4. 考核依据 本课程考核说明是依据国家开放大学《大数据技术课程教学大纲》、文字教 材《大数据技术原理与应用(第 3 版)》(林子雨编著,人民邮电出版社,2021 年 1 月第 3 版)制定的。本课程考核说明是课程考核命题的基本依据。 二、考核内容及要求 1.考核内容 考核内容为本课程学习的主要内容,主要包括:大数据的基本概念、大数 据处理架构 Hadoop、分布式文件系统 HDFS、分布式数据库 HBase、NoSQL 数 据库、云数据库、分布式并行编程模型 MapReduce、数据可视化以及大数据在 互联网、生物医学和物流等各个领域的应用。 2.考核要求 本考核说明将使用下列术语分别表明几种要求层次: ① 掌握:能运用有关知识熟练解决最基本的问题或者能综合运用相关知识 解决有一定难度的问题; ② 理解:能运用有关知识解决一般的问题;

③了解:对于这一要求层次的内容,能理解有关的知识即可。 三、考核方式及计分方法 本课程考核采用形成性考核与终结性考试相结合的方式。形成性考核占课 程综合成绩的50%,终结性考试占课程综合成绩的50%。课程考核成绩统一采 用百分制,即形成性考核、终结性考试、课程综合成绩均采用百分制: 课程综合成绩达到60分及以上(及格),可获得本课程相应学分, 1.形成性考核 (1)考核目的 加强对学生平时自主学习过程的指导和监督,重在对学生自主学习过程进行 指导和检测,引导学生按照教学要求和学习计划完成学习任务,达到掌摆知识 提高能力的目标,提高学生的综合素质。与开故大学系统教师共同实现教学过程 的引导、指导和管理。 (2)考核手段 木课程形成性考核成绩占总成绩的50%,满分100分。形成性考核成绩包括 形成性任务成绩和学习过程表现成锁两部分,形成性任务成镜占形成性考核成锁 的80%,学习过程表现成绩占形成性考核成绩的20%。学习过程表现成绩评定由 各学习中心辅导教师根据学生国开网上学习进度条”和“发帖统计“进行评分。 (3)形成性考核任务的形式及计分方法 形成性考核任务列表 序次 内容 形式 开始时间 结束时间 权重 第1-3章 完成相关测试题1 第2周 第15周术 20% 2 第46章 完成相关测试题2 第4周 第15周末 20% 3 第7-10章 完成相关测试题3 第6周 第15周末 20% 第11-12章 完成相关测试题4 第8周 第15周末 20% 2终结性考被 (1)考试目的 终结性考试是在形成性考核的基础上,对学生学习情况和学习效果进行的一 次全面检测
③ 了解:对于这一要求层次的内容,能理解有关的知识即可。 三、考核方式及计分方法 本课程考核采用形成性考核与终结性考试相结合的方式。形成性考核占课 程综合成绩的 50%,终结性考试占课程综合成绩的 50%。课程考核成绩统一采 用百分制,即形成性考核、终结性考试、课程综合成绩均采用百分制。 课程综合成绩达到 60 分及以上(及格),可获得本课程相应学分。 1. 形成性考核 (1)考核目的 加强对学生平时自主学习过程的指导和监督,重在对学生自主学习过程进行 指导和检测,引导学生按照教学要求和学习计划完成学习任务,达到掌握知识、 提高能力的目标,提高学生的综合素质。与开放大学系统教师共同实现教学过程 的引导、指导和管理。 (2)考核手段 本课程形成性考核成绩占总成绩的 50%,满分 100 分。形成性考核成绩包括 形成性任务成绩和学习过程表现成绩两部分,形成性任务成绩占形成性考核成绩 的 80%,学习过程表现成绩占形成性考核成绩的 20%。学习过程表现成绩评定由 各学习中心辅导教师根据学生国开网上学习“进度条”和“发帖统计”进行评分。 (3)形成性考核任务的形式及计分方法 形成性考核任务列表 序次 内容 形式 开始时间 结束时间 权重 1 第 1-3 章 完成相关测试题 1 第 2 周 第 15 周末 20% 2 第 4-6 章 完成相关测试题 2 第 4 周 第 15 周末 20% 3 第 7-10 章 完成相关测试题 3 第 6 周 第 15 周末 20% 4 第 11-12 章 完成相关测试题 4 第 8 周 第 15 周末 20% 2.终结性考核 (1)考试目的 终结性考试是在形成性考核的基础上,对学生学习情况和学习效果进行的一 次全面检测

(2)命恩原则 ①本课程的考试命题严格控制在教学大钢规定的教学内容和教学要求的范 围之内。 ②考试命题覆盖本课程教材的1-12章,既全面,又突出重点, ③每份试在所考的内容,覆盖木课程教材所学内容的90%以上的章节, ④试圈应难易适中,一般米讲,可分为:容易、适中、较难三个程度,所占 比例大致为:容易占30%,适中占50%,较难占20%。 (3)考试手段:网络考试. (4)考试方式:闭卷。 (5)考试时限:60分钟. (6)阴末试盟类型及分值: 卷面分值100分,其中 1.单项选择题(每题2分,共30分): 2.多项选择题(每题4分,共20分): 3.判断题(每题3分,共30分)1 4.简答题(每题10分,共20分)方 (三》试题举例 一、单项选择思 1、大数据的核心就是(B》 A,告知与许可B、顶测C、匿名化D、规模化 2、大数据不是要教机器像人一样思考。相反,它是(A) A,把数学算法运用到海量的数据上来预测事情发生的可能性。B、被视为人 工智能的一高分。 C、被视为一种机器学习,D、预测与惩罚。 3、采样分析的精确性随着采样随机性的增加而(),但与样本数量的增加 关系不大。 A,降低B、不变C、提高D、无关 4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法 A、所有数据B、绝大部分数据C、适量数据D、少量数据 5、大数据的简单算法与小数据的复杂算法相比(A) A,更有效B、相当C、不具备可比性D、无效 二、多项选择题 1、大数据与三个重大的思推转变有关,这三个转变是什么?(ACD),A、要 分析与某事物相关的所有数据。面不是依靠分析少量的数据样本。 B、我们乐于接受数据的纷繁复杂,而不再追求精确性。 C、在数字化时代,数据处理变得更加容易、更加快速,人们能够在解间处 理成千上万的数据
(2)命题原则 ①本课程的考试命题严格控制在教学大纲规定的教学内容和教学要求的范 围之内。 ②考试命题覆盖本课程教材的 1-12 章,既全面,又突出重点。 ③每份试卷所考的内容,覆盖本课程教材所学内容的 90%以上的章节。 ④试题应难易适中,一般来讲,可分为:容易、适中、较难三个程度,所占 比例大致为:容易占 30%,适中占 50%,较难占 20%。 (3)考试手段:网络考试。 (4)考试方式:闭卷。 (5)考试时限:60 分钟。 (6)期末试题类型及分值: 卷面分值 100 分,其中 1.单项选择题(每题 2 分,共 30 分); 2. 多项选择题(每题 4 分,共 20 分); 3. 判断题(每题 3 分,共 30 分); 4. 简答题(每题 10 分,共 20 分); (三)试题举例 一、单项选择题 1、大数据的核心就是(B) A、告知与许可 B、预测 C、匿名化 D、规模化 2、大数据不是要教机器像人一样思考。相反,它是(A) A、把数学算法运用到海量的数据上来预测事情发生的可能性。B、被视为人 工智能的一部分。 C、被视为一种机器学习。D、预测与惩罚。 3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加 关系不大。 A、降低 B、不变 C、提高 D、无关 4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法 A、所有数据 B、绝大部分数据 C、适量数据 D、少量数据 5、大数据的简单算法与小数据的复杂算法相比(A) A、更有效 B、相当 C、不具备可比性 D、无效 二、多项选择题 1、大数据与三个重大的思维转变有关,这三个转变是什么?(ACD)。A、要 分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。 B、我们乐于接受数据的纷繁复杂,而不再追求精确性。 C、在数字化时代,数据处理变得更加容易、更加快速,人们能够在瞬间处 理成千上万的数据

D、我们的思想发生了转变,不再探求难以捉摸的因果关系。转而关注事物 的相关关系。 2、下面关于大数据的解说正确的是(ABC). A,大数据是人们在大规模数据的基础上可以做到的事情,面这些事情在小 规模数据的基础上是无法完成的。 B、大数据是人们获得断的认知、创造新的价值的源泉, C、大数据还是改变市场、组织机构,以及政府与公民关系的方法, D、无效的数据越来越多。 3、大数据的科学价值和社会价值正是体现在(AB) A,一方面,对大数据的掌握程度可以转化为经济价值的来源。 B、另一方面,大数据己经撼动了世界的方方面面,从商业科技到医疗、政 府、教育、经济、人文以及社会的其他各个领域。 C,大数据的价值不再单纯米源于它的基本用途,而更多源于它的二次利用。 D、大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产 生了很多创新性的用途。 4、关于大数据的说话正确的有(ABC) A,大数据时代要求我们重新审视精确性的优劣 B、大数据不仅让我们不再期待精确性,也让我们无法实现精确性 C,错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题, 并且有可使长期存在。 D、错误性是大数据本身固有的。 5、社会将两个折中的想法不知不觉地渗入了我们的处事方法中,我们甚至 不再把这当成一种折中,而是把它当成了事物的自然状态,这两个折中的方法是 什么?(AB) A,第一个折中是我们默认自己不能使用更多的数据,所以我们就不会去使 用更多的数据。 B、第二个折中出现在数据的质量上 C、第一个折中是我们能够容忍模糊和不确定出现在一些过去依赖于清晰和 精确的领域, D、第二个折中是能够得到一个事物更完整的概念,我们就能 接受模脚和不确定的存在。 三、判断愿 1、采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的 增加关系不大。(√) 2、内大数据是指不用随机分析法这样的捷径,而采用所有数据的方法.(√) 3、要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该 是竭力避免的。(√) 4、数据化就是数字化,是相互等同的关系。(×) 5、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。(√) 四、简答题 1.举例说明Hadoop的体系结构。 Hadoop其实是由一系列的软件库组成的框架。这些软件库也可称作功能模
D、我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物 的相关关系。 2、下面关于大数据的解说正确的是(ABC)。 A、大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小 规模数据的基础上是无法完成的。 B、大数据是人们获得新的认知、创造新的价值的源泉。 C、大数据还是改变市场、组织机构,以及政府与公民关系的方法。 D、无效的数据越来越多。 3、大数据的科学价值和社会价值正是体现在(AB) A、一方面,对大数据的掌握程度可以转化为经济价值的来源。 B、另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政 府、教育、经济、人文以及社会的其他各个领域。 C、大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用。 D、大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产 生了很多创新性的用途。 4、关于大数据的说话正确的有(ABC) A、大数据时代要求我们重新审视精确性的优劣。 B、大数据不仅让我们不再期待精确性,也让我们无法实现精确性。 C、错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题, 并且有可能长期存在。 D、错误性是大数据本身固有的。 5、社会将两个折中的想法不知不觉地渗入了我们的处事方法中,我们甚至 不再把这当成一种折中,而是把它当成了事物的自然状态。这两个折中的方法是 什么?(AB) A、第一个折中是我们默认自己不能使用更多的数据,所以我们就不会去使 用更多的数据。 B、第二个折中出现在数据的质量上。 C、第一个折中是我们能够容忍模糊和不确定出现在一些过去依赖于清晰和 精确的领域。 D、第二个折中是能够得到一个事物更完整的概念,我们就能 接受模糊和不确定的存在。 三、判断题 1、采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的 增加关系不大。(√) 2、内大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。(√) 3、要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该 是竭力避免的。(√) 4、数据化就是数字化,是相互等同的关系。(×) 5、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。(√) 四、简答题 1. 举例说明 Hadoop 的体系结构。 Hadoop 其实是由一系列的软件库组成的框架。这些软件库也可称作功能模

块,它们各白负责了Hadoop的一部分功能,其中最主要的是Common、HDFs和 YARN。Common提供远程调用RPC,序列化机制,HDF5负责数据的存储,YARN 则负责统一资源调度和管理等。 2.HDF5中数据副本的存放策略是什么? HDFS默认的副本系数是3,这适用于大多数情况。副本存放策略是将第一个 副本存放在本地机架的节点上将第二个副本故在同一机架的另一个节点上将第 三个副本放在不同机架的节点上。这种策略减少了机架间的数据传输,这就提高 了写操作的效书
块,它们各自负责了 Hadoop 的一部分功能,其中最主要的是 Common、HDFS 和 YARN。Common 提供远程调用 RPC、序列化机制,HDFS 负责数据的存储,YARN 则负责统一资源调度和管理等。 2.HDFS 中数据副本的存放策略是什么? HDFS 默认的副本系数是 3,这适用于大多数情况。副本存放策略是将第一个 副本存放在本地机架的节点上,将第二个副本放在同一机架的另一个节点上,将第 三个副本放在不同机架的节点上。这种策略减少了机架间的数据传输,这就提高 了写操作的效率