
《大数据管理》课程大纲一、课程名称:大数据管理二、课程性质:选修、理论+实践课三、学时与学分:40学时(理论学时:28,实验学时:12),2.5学分四、课程先导课:数据结构、C语言、大数据导论等五、课程简介“大数据管理”是一门同时包含理论方法和工程技术知识的综合性专业选修课程,在计算机学科课程系列中属于中后期课程,以数据结构等课程知识为基础讲述数据工程领域的大数据管理理论与技术。课程首先综述数据管理系统的发展,分析发展大数据管理系统的必要性,并依据数据建模和系统设计两个维度展开。在数据模型方面,主要涵盖关系数据模型与SQL、键值对数据模型、文档模型及其查询语言、图模型及相关的类SQL查询语言。在系统设计方面,涵盖典型大数据系统的系统结构、数据存储与组织、索引技术、分布式查询处理、分布式事务、故障恢复及系统保护等内容。课程引导学生探寻大数据管理的发展趋势:掌握相关的主要方法与技术,培养学生面对大数据背景下的复杂工程问题的分析和解决问题的能力。六、课程目标通过对于目前大数据的理论与工程技术的现状综述分析,让学生对于大数据管理的主流方法与技术、发展方向形成客观全面的认识,具备调研和系统分析问题的能力。通过对关系模型、半结构化文档数据模型、键值对模型和图数据模型等典型数据模型及其科学方法的学习,培养学生依据工程科学、计算机科学对大数据复杂工程问题的理解、描述和分析能力。通过典型的大数据系统的系统架构、数据组织与存储策略、查询处理优化、分布式事务处理、故障恢复与系统保护机制等多个方面主流方法的学习,让学生对大数据管理的主要技术有较为全面和深刻的认识,并能结合阅读、分析与实践,具备初步的设计与开发能力课程的具体目标包括:目标1:能够从数据建模的角度识别、判断和分析复杂大数据应用需求中数据管理方面存在的科学问题,能综合考虑现有的关系模型、文档模型、键值对模型、图数据模型等典型数据模型对复杂大数据工程应用的数据管理核心问题进行抽象描述和分析;对于大数据管理的时代背景、典型方法与技术、主流系统及其架构有较为全面的认识,形成针对复杂工程问题的初步设计与解决能力
《大数据管理》课程大纲 一、课程名称:大数据管理 二、课程性质:选修、理论+实践课 三、学时与学分:40 学时(理论学时:28,实验学时:12),2.5 学分 四、课程先导课:数据结构、C 语言、大数据导论等 五、课程简介 “大数据管理”是一门同时包含理论方法和工程技术知识的综合性专业选修 课程,在计算机学科课程系列中属于中后期课程,以数据结构等课程知识为基础, 讲述数据工程领域的大数据管理理论与技术。课程首先综述数据管理系统的发展, 分析发展大数据管理系统的必要性,并依据数据建模和系统设计两个维度展开。 在数据模型方面,主要涵盖关系数据模型与 SQL、键值对数据模型、文档模型 及其查询语言、图模型及相关的类 SQL 查询语言。在系统设计方面,涵盖典型 大数据系统的系统结构、数据存储与组织、索引技术、分布式查询处理、分布式 事务、故障恢复及系统保护等内容。课程引导学生探寻大数据管理的发展趋势, 掌握相关的主要方法与技术,培养学生面对大数据背景下的复杂工程问题的分析 和解决问题的能力。 六、课程目标 通过对于目前大数据的理论与工程技术的现状综述分析,让学生对于大数据 管理的主流方法与技术、发展方向形成客观全面的认识,具备调研和系统分析问 题的能力。通过对关系模型、半结构化文档数据模型、键值对模型和图数据模型 等典型数据模型及其科学方法的学习,培养学生依据工程科学、计算机科学对大 数据复杂工程问题的理解、描述和分析能力。通过典型的大数据系统的系统架构、 数据组织与存储策略、查询处理优化、分布式事务处理、故障恢复与系统保护机 制等多个方面主流方法的学习,让学生对大数据管理的主要技术有较为全面和深 刻的认识,并能结合阅读、分析与实践,具备初步的设计与开发能力。 课程的具体目标包括: 目标 1:能够从数据建模的角度识别、判断和分析复杂大数据应用需求中数 据管理方面存在的科学问题,能综合考虑现有的关系模型、文档模型、键值对模 型、图数据模型等典型数据模型对复杂大数据工程应用的数据管理核心问题进行 抽象描述和分析;对于大数据管理的时代背景、典型方法与技术、主流系统及其 架构有较为全面的认识,形成针对复杂工程问题的初步设计与解决能力

目标2:对于大数据管理的时代背景、典型方法与技术、数据模型及其查询语言、主流系统有较为基本的认识,能够把握技术发展的特点和方向,对于新技术具备调研、综述、比较、分析能力;目标3:理解现有代表性大数据系统的系统架构、组织与存储、查询处理优化、分布式事务管理、故障恢复的典型方法,并能结合阅读与调研,进一步掌握技术的发展趋势,形成针对复杂工程问题的初步设计与解决能力。七、课程目标对毕业要求的支撑关系对应课程支撑的毕业要求一级指标点支撑的毕业要求二级指标点目标2.1能综合运用数学、自然科学、目标1,工程科学以及计算机科学的基本原理,识别、判断和表达计算目标2机复杂工程问题的关键环节,具有问题抽象能力12.2具备自主学习能力,能通过目标3多种途径拓展自己的知识和能力,包括理解能力,归纳总结的能力和提出问题的能力等八、教学设计及对课程目标的支持第一章数据管理系统概述主要知识点包括:数据管理系统的发展历史:大数据管理系统的特征:大数据管理系统的组成。1.教学目标1)了解数据管理技术的发展历史2)理解数据库、数据仓库、大数据管理系统之间的区别与联系;3)理解大数据管理系统的数据特征、系统特征和应用特征;4)了解大数据管理系统的组成。本章教学支持的课程目标为目标1、目标2。2.教学重点1)大数据管理系统的特征大数据管理系统从数据特征、系统特征、应用特征三个方面与传统的数据库系统或者数据仓库系统有着较大的改变,通过多个角度全面理解大数据管理系统的需求和相关技术的发展。2)大数据管理系统的组成
目标 2:对于大数据管理的时代背景、典型方法与技术、数据模型及其查询 语言、主流系统有较为基本的认识,能够把握技术发展的特点和方向,对于新技 术具备调研、综述、比较、分析能力; 目标 3:理解现有代表性大数据系统的系统架构、组织与存储、查询处理优 化、分布式事务管理、故障恢复的典型方法,并能结合阅读与调研,进一步掌握 技术的发展趋势,形成针对复杂工程问题的初步设计与解决能力。 七、课程目标对毕业要求的支撑关系 支撑的毕业要求一级指标点 支撑的毕业要求二级指标点 对应课程 目标 2.1 能综合运用数学、自然科学、 工程科学以及计算机科学的基 本原理,识别、判断和表达计算 机复杂工程问题的关键环节,具 有问题抽象能力 目标 1, 目标 2 12.2 具备自主学习能力,能通过 多种途径拓展自己的知识和能 力,包括理解能力,归纳总结的 能力和提出问题的能力等 目标 3 八、教学设计及对课程目标的支持 第一章 数据管理系统概述 主要知识点包括:数据管理系统的发展历史;大数据管理系统的特征;大数 据管理系统的组成。 1.教学目标 1)了解数据管理技术的发展历史; 2)理解数据库、数据仓库、大数据管理系统之间的区别与联系; 3)理解大数据管理系统的数据特征、系统特征和应用特征; 4)了解大数据管理系统的组成。 本章教学支持的课程目标为目标 1、目标 2。 2.教学重点 1)大数据管理系统的特征 大数据管理系统从数据特征、系统特征、应用特征三个方面与传统的数据库 系统或者数据仓库系统有着较大的改变,通过多个角度全面理解大数据管理系统 的需求和相关技术的发展。 2)大数据管理系统的组成

大数据管理系统的组成包括多引擎系统结构、混合负载系统架构、分布式系统架构等典型特征。3.教学难点1)大数据管理系统的系统特征目前不大数据管理系统技术还在快速进化中,还没有成型,需要在结合现有相关工作理解系统的开放性、量质融合、以知识管理为中心的系统特征。2)理解大数据管理系统目前的核心技术需求和发展趋势现阶段还处于大数据应用的初期,现有系统的重点还在于能做什么,而无暇顾及做得如何,因此要切实理解管理的成分还不够多,效率的问题还没有师风突出。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕不同数据特征、系统核心技术发展、应用需求、系统架构特征等内容展开。2)作业围绕大数据管理的特征和系统组成等内容布置。3)课外阅读阅读大数据的产生及现有代表性系统的相关学术论文。第二章关系数据模型与SQL主要知识点包括:关系数据库概述;关系数据库标准语言SQL;SQLonHadoop;NoSQL数据库:代表性的关系数据库。1.教学目标1)了解关系数据库的基本概念、操作与实现技术:2)把握SQL基本语法和扩展语法的特征:3)了解SQLonHadoop的典型应用案例;4)了解NoSQL数据库的特点和代表性系统:5)了解代表性的关系、MPP、NewSQL数据库。本章教学支持的课程目标为目标1、目标2。2.教学重点1)SQL基本语法和扩展语法的特征SQL基本语法面向关系型结构化数据,支持嵌套的复杂语法结构:SQL扩展主要面向JSON、R语言集成、Hadoop等大数据下的多种数据形式和应用环境通过学习SQL的发展了解数据管理在操作处理层面的发展过程
大数据管理系统的组成包括多引擎系统结构、混合负载系统架构、分布式系 统架构等典型特征。 3.教学难点 1)大数据管理系统的系统特征 目前不大数据管理系统技术还在快速进化中,还没有成型,需要在结合现有 相关工作理解系统的开放性、量质融合、以知识管理为中心的系统特征。 2)理解大数据管理系统目前的核心技术需求和发展趋势 现阶段还处于大数据应用的初期,现有系统的重点还在于能做什么,而无暇 顾及做得如何,因此要切实理解管理的成分还不够多,效率的问题还没有师风突 出。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、 作业、课外阅读等教学形 式。 1)课堂讨论 围绕不同数据特征、系统核心技术发展、应用需求、系统架构特征等内容展 开。 2)作业 围绕大数据管理的特征和系统组成等内容布置。 3)课外阅读 阅读大数据的产生及现有代表性系统的相关学术论文。 第二章 关系数据模型与 SQL 主要知识点包括:关系数据库概述;关系数据库标准语言 SQL;SQL on Hadoop; NoSQL 数据库;代表性的关系数据库。 1.教学目标 1)了解关系数据库的基本概念、操作与实现技术; 2)把握 SQL 基本语法和扩展语法的特征; 3)了解 SQL on Hadoop 的典型应用案例; 4)了解 NoSQL 数据库的特点和代表性系统; 5)了解代表性的关系、MPP、NewSQL 数据库。 本章教学支持的课程目标为目标 1、目标 2。 2.教学重点 1) SQL 基本语法和扩展语法的特征 SQL 基本语法面向关系型结构化数据,支持嵌套的复杂语法结构;SQL 扩展 主要面向 JSON、R 语言集成、Hadoop 等大数据下的多种数据形式和应用环境, 通过学习 SQL 的发展了解数据管理在操作处理层面的发展过程

2)NoSQL数据库大数据管理系统目前的典型系统多为NoSQL数据库,包括键值对、列存储、文档、图数据库等多种形式。3.教学难点1)理解SQL面向大数据的扩展大数据背景下数据的结构化特征往往被弱化,学习JSON等若结构数据下的SQL,需要从关系数据模型角度理解SQL的内部动作,还需结合若结构化数据的数据特征灵活分析数据处理的新内涵。2)理解NoSQL数据库的系统变革NoSQL数据库并非排斥SQL数据库,而是更加广泛的notonlySQL,现有典型系统往往是在传统SQL数据库基础上,放弃一些大数据环境下的一致性需求,但对于存储、分布式、可用性等技术则提出了更适合大规模机群的新方法和技术。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕不同NoSQL和NewSQL数据库的数据组织、系统架构、数据管理功能特点等等内容展开。2)作业围绕NoSQL典型系统的特征和系统架构等内容布置。3)课外阅读阅读NoSQL数据库的产生及现有典型系统代表性技术的相关学术论文。第三章键值对数据模型主要知识点包括:键值对模型基本概念;键值对模型应用现状;Dynamo、Redis、RAMCloud、BigTable等典型键值对数据库的数据结构和数据操作方法。1.教学目标1)了解键值对模型的典型应用背景和实例2)了解当前典型的键值对模型的应用现状和功能特色;3)理解Dynamo数据库如何通过键值对模型管理数据:4)理解Redis数据库如何通过键值对模型管理数据:5)理解RAMCloud数据库如何通过键值对模型管理数据6)理解BigTable数据库如何通过键值对模型管理数据。本章教学支持的课程目标为目标1、目标2。2.教学重点1)Redis系统的键值对数据操作方法
2) NoSQL 数据库 大数据管理系统目前的典型系统多为 NoSQL 数据库,包括键值对、列存储、 文档、图数据库等多种形式。 3.教学难点 1) 理解 SQL 面向大数据的扩展 大数据背景下数据的结构化特征往往被弱化,学习 JSON 等若结构数据下的 SQL,需要从关系数据模型角度理解 SQL 的内部动作,还需结合若结构化数据的 数据特征灵活分析数据处理的新内涵。 2) 理解 NoSQL 数据库的系统变革 NoSQL 数据库并非排斥 SQL 数据库,而是更加广泛的 not only SQL,现有典 型系统往往是在传统 SQL 数据库基础上,放弃一些大数据环境下的一致性需求, 但对于存储、分布式、可用性等技术则提出了更适合大规模机群的新方法和技术。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、 作业、课外阅读等教学形 式。 1)课堂讨论 围绕不同 NoSQL 和 NewSQL 数据库的数据组织、系统架构、数据管理功能特 点等等内容展开。 2)作业 围绕 NoSQL 典型系统的特征和系统架构等内容布置。 3)课外阅读 阅读 NoSQL 数据库的产生及现有典型系统代表性技术的相关学术论文。 第三章 键值对数据模型 主要知识点包括:键值对模型基本概念;键值对模型应用现状;Dynamo、Redis、 RAMCloud、BigTable 等典型键值对数据库的数据结构和数据操作方法。 1.教学目标 1)了解键值对模型的典型应用背景和实例; 2)了解当前典型的键值对模型的应用现状和功能特色; 3)理解 Dynamo 数据库如何通过键值对模型管理数据; 4)理解 Redis 数据库如何通过键值对模型管理数据; 5)理解 RAMCloud 数据库如何通过键值对模型管理数据; 6)理解 BigTable 数据库如何通过键值对模型管理数据。 本章教学支持的课程目标为目标 1、目标 2。 2.教学重点 1)Redis 系统的键值对数据操作方法

Redis系统不仅仅停留在对键值对数据的基本操作,还支持哈希、列表、集合、有序集合等数据结构,支持数据持久化。2)BigTable系统键值对数据操作方法BigTable为了解决搜索引擎的数据采集和搜索需求,在键值对的基本思想下,通过列族、时间戳、行区间等技术,对大规模的网页信息实现了灵活高效的管理。3.教学难点1)理解Redis系统在键值对思想基础上如何细化数据类型键值对数据模型宏观上是对于数据结构的更加抽象的管理,目的是便于组织大规模、多结构化数据,但是高效的组织和良好的访问性能还是需要细致的内部实现机制,引入科学的数据操作方法。2)理解BigTable系统的键值对数据组织策略如何支持大数据的分布式管理BigTable在宏观上仍然保留了关系数据库的table的模式思想,但仅是在列族这个层面,而列族内部则通过灵活的列定义和时间戳实现了更加灵活的管理,有了列族和行区间的设计思想,才能更好的实现对于列存储的支持。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕Dynamo、Redis和BigTable的键值对数据操作新技术展开。2)作业围绕键值对数据管理系统的典型数据结构等内容布置。3)课外阅读阅读大数据背景下使用键值对数据模型的代表性系统关于数据操纵方面的相关学术论文。第四章文档模型与查询语言主要知识点包括:文档数据及其模型概述;XML和JSON为代表的文档结构;文档查询语言(DOM接口及其应用实例;XQuery及其应用实例;FLWOR;XPath及应用实例:JSONAPI及应用实例):文档数据库举例(eXistDB和MongDB)。1.教学目标1)了解文档数据库的无结构、隐式结构、半结构特点;②)掌握XML数据的结构组成及基本描述方法;3)掌握JSON数据的特点及其主要语法元素;4)理解xQuery语言的特点和基本使用方法:5)了解JSONAPI的基本使用方法;6)了解eXistDB文档数据库的基本结构、数据模型和查询语言:
Redis 系统不仅仅停留在对键值对数据的基本操作,还支持哈希、列表、集 合、有序集合等数据结构,支持数据持久化。 2)BigTable 系统键值对数据操作方法 BigTable 为了解决搜索引擎的数据采集和搜索需求,在键值对的基本思想下, 通过列族、时间戳、行区间等技术,对大规模的网页信息实现了灵活高效的管理。 3.教学难点 1)理解 Redis 系统在键值对思想基础上如何细化数据类型 键值对数据模型宏观上是对于数据结构的更加抽象的管理,目的是便于组织 大规模、多结构化数据,但是高效的组织和良好的访问性能还是需要细致的内部 实现机制,引入科学的数据操作方法。 2)理解 BigTable 系统的键值对数据组织策略如何支持大数据的分布式管理 BigTable 在宏观上仍然保留了关系数据库的 table 的模式思想,但仅是在 列族这个层面,而列族内部则通过灵活的列定义和时间戳实现了更加灵活的管理, 有了列族和行区间的设计思想,才能更好的实现对于列存储的支持。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、 作业、课外阅读等教学形 式。 1)课堂讨论 围绕 Dynamo、Redis 和 BigTable 的键值对数据操作新技术展开。 2)作业 围绕键值对数据管理系统的典型数据结构等内容布置。 3)课外阅读 阅读大数据背景下使用键值对数据模型的代表性系统关于数据操纵方面的 相关学术论文。 第四章 文档模型与查询语言 主要知识点包括:文档数据及其模型概述;XML 和 JSON 为代表的文档结构; 文档查询语言(DOM 接口及其应用实例;XQuery 及其应用实例;FLWOR;XPath 及应用实例;JSON API 及应用实例);文档数据库举例(eXistDB 和 MongDB)。 1.教学目标 1)了解文档数据库的无结构、隐式结构、半结构特点; 2)掌握 XML 数据的结构组成及基本描述方法; 3)掌握 JSON 数据的特点及其主要语法元素; 4)理解 XQuery 语言的特点和基本使用方法; 5)了解 JSON API 的基本使用方法; 6)了解 eXistDB 文档数据库的基本结构、数据模型和查询语言;

7)了解MongoDB数据库的系统结构,理解其数据模型,掌握其数据操纵语言的基本使用方法。本章教学支持的课程目标为目标1和目标2。2.教学重点1)典型的文档数据结构结合当前代表性的存储、处理和传输文档数据系统和方法,学习半结构化数据文档模型的表示和操作。理解XML结构中数据模式DTD的逻辑结构和语法、数据转换XSL样式语言和数据表示、数据引用XLL中的数据交叉引用和链接。掌握JSON结构中JS对象序列化、对象、数组的表示方法。②)MongoDB数据库的数据操纵掌握基本的数据库操作:数据的创建、删除和修改操作:排序、索引、条件查询、聚合查询、模糊查询、数据管道等查询操作。3.教学难点1)理解XML和JSON为代表的的文档数据结构特点总体上相对于关系数据库的结构化,文档型数据库具有相对灵活的数据结构组成,具有半结构化或非结构化的特点。另一方面,在典型的文档数据库中,仍然会针对常见的应用需求实现一些细节的数据定义和使用方式。通过对于JSON数据的学习,理解其与关系数据的关联和区别。2)较好的掌握MongoDB的数据操纵方法在理解MongoDb数据基本结构的基础上,能够分析MongoDB和SQL在查询上的区别与联系,能正确运用其查询语言完成聚合、多条件等查询动作,能正确运用数据管道完成较复杂的查询。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕XML和JSON数据结构、MongoDB数据操纵方法等内容展开。2)作业围绕XML和JSON数据描述、MongoDB数据操纵等内容布置。3)课外阅读阅读JSON类型数据、MongoDB数据操纵方法等方面的相关学习资料。4)配套实验本章的教学内容需要与实验相结合,要求学生能在MongoDB数据库上进行实际操作,能够正确使用其查询语言,完成相关的数据访问任务需求。为达到教学效果,实验指导由承担课程教学任务的任课教师承担
7)了解 MongoDB 数据库的系统结构,理解其数据模型,掌握其数据操纵语言 的基本使用方法。 本章教学支持的课程目标为目标 1 和目标 2。 2.教学重点 1)典型的文档数据结构 结合当前代表性的存储、处理和传输文档数据系统和方法,学习半结构化数据文档 模型的表示和操作。理解 XML 结构中数据模式 DTD 的逻辑结构和语法、数据转换 XSL 样式语言和数据表示、数据引用 XLL 中的数据交叉引用和链接。掌握 JSON 结构中 JS 对象序列化、对象、数组的表示方法。 2)MongoDB 数据库的数据操纵 掌握基本的数据库操作;数据的创建、删除和修改操作;排序、索引、条件 查询、聚合查询、模糊查询、数据管道等查询操作。 3.教学难点 1)理解 XML 和 JSON 为代表的的文档数据结构特点 总体上相对于关系数据库的结构化,文档型数据库具有相对灵活的数据结构 组成,具有半结构化或非结构化的特点。另一方面,在典型的文档数据库中,仍 然会针对常见的应用需求实现一些细节的数据定义和使用方式。通过对于 JSON 数据的学习,理解其与关系数据的关联和区别。 2)较好的掌握 MongoDB 的数据操纵方法 在理解 MongoDb 数据基本结构的基础上,能够分析 MongoDB 和 SQL 在查询上 的区别与联系,能正确运用其查询语言完成聚合、多条件等查询动作,能正确运 用数据管道完成较复杂的查询。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、 作业、课外阅读等教学形 式。 1)课堂讨论 围绕 XML 和 JSON 数据结构、MongoDB 数据操纵方法等内容展开。 2)作业 围绕 XML 和 JSON 数据描述、MongoDB 数据操纵等内容布置。 3)课外阅读 阅读 JSON 类型数据、MongoDB 数据操纵方法等方面的相关学习资料。 4)配套实验 本章的教学内容需要与实验相结合,要求学生能在 MongoDB 数据库上进行实 际操作,能够正确使用其查询语言,完成相关的数据访问任务需求。为达到教学 效果,实验指导由承担课程教学任务的任课教师承担

第五章图模型与类SQL查询语言主要知识点包括:图的数据结构及其形式化定义,包括简单图、标签图和属性图;图数据操作,包括图匹配、图导航、图与关系的复合操作;图查询语言Cypher的对象创建、检索和更新;Neo4j图数据库简介及其应用实例。1.教学目标1)掌握图的基本数据结构;2)掌握图匹配和图导航两类基本的图操作:3)了解图与关系的复杂操作;4)掌握一种图查询语言的基本语法;5)了解主流图数据库的管理技术;6)了解图计算的典型任务及执行方式。本章教学支持的课程目标为目标1和目标2。2.教学重点1)图数据结构的基本要素及其形式化定义理解简单图、标签图和属性图的各自构成特征,理解图对于信息世界的表达方式,理解三种图数据之间的联系和区别,掌握RDF资源描述框架对于图的描述方法。2)图操作语言学习图操作语言Cypher,掌握图对象创建、检索、匹配、导航、图与关系复合操作、更新等具体操作的语法。3.教学难点1)理解并掌握基本的RDF和OWL描述方法RDF及其扩展OWL语言的目标是能确切描述Web信息的含义,并且Web信息可被计算机理解和处理,进而可以从网络上整合信息。通过学习要能理解用OWL表示的知识可以通过计算机程序进行推理(演绎推理),从而验证知识一致性,或者使隐性知识显性化。2)Cypher语言实现复杂条件图检索操作Cypher是一个申明式的语言,对比命令式语言如Java和脚本语言如Gremlin和JRuby,它的焦点在于从图中找回的内容是什么(whattoretrieve),而不是怎么去做。通过学习掌握它的许多关键字如like和orderby与SQL的相似之处、模式匹配的表达式来自于SPARQL、正则表达式匹配实现实用Scalaprogramminglanguage语言的特点。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式
第五章 图模型与类 SQL 查询语言 主要知识点包括:图的数据结构及其形式化定义,包括简单图、标签图和属 性图;图数据操作,包括图匹配、图导航、图与关系的复合操作;图查询语言 Cypher 的对象创建、检索和更新;Neo4j 图数据库简介及其应用实例。 1.教学目标 1) 掌握图的基本数据结构; 2) 掌握图匹配和图导航两类基本的图操作; 3) 了解图与关系的复杂操作; 4) 掌握一种图查询语言的基本语法; 5) 了解主流图数据库的管理技术; 6) 了解图计算的典型任务及执行方式。 本章教学支持的课程目标为目标 1 和目标 2。 2.教学重点 1) 图数据结构的基本要素及其形式化定义 理解简单图、标签图和属性图的各自构成特征,理解图对于信息世界的表达 方式,理解三种图数据之间的联系和区别,掌握 RDF 资源描述框架对于图的描述 方法。 2) 图操作语言 学习图操作语言 Cypher,掌握图对象创建、检索、匹配、导航、图与关系 复合操作、更新等具体操作的语法。 3.教学难点 1) 理解并掌握基本的 RDF 和 OWL 描述方法 RDF 及其扩展 OWL 语言的目标是能确切描述 Web 信息的含义,并且 Web 信息 可被计算机理解和处理,进而可以从网络上整合信息。通过学习要能理解用 OWL 表示的知识可以通过计算机程序进行推理(演绎推理),从而验证知识一致性,或 者使隐性知识显性化。 2) Cypher 语言实现复杂条件图检索操作 Cypher是一个申明式的语言,对比命令式语言如Java和脚本语言如Gremlin 和 JRuby,它的焦点在于从图中找回的内容是什么(what to retrieve),而不 是怎么去做。通过学习掌握它的许多关键字如 like 和 order by 与 SQL 的相似之 处、模式匹配的表达式来自于 SPARQL、正则表达式匹配实现实用 Scala programming language 语言的特点。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、 作业、课外阅读等教学形 式

1)课堂讨论围绕图数据结构、图基本操作、图计算典型任务等内容展开。2)作业围绕图的定义、查询、更新等内容布置。3)课外阅读阅读大数据背景下知识图谱类型数据、图数据引擎、操作语言等方面的相关学习资料。4)配套实验本章的教学内容需要与实验相结合,要求学生能在Neo4i图数据库上进行实际操作,能够正确使用其查询语言,完成相关的数据访问任务需求。为达到教学效果,实验指导由承担课程教学任务的任课教师承担。第六章大数据管理系统的体系架构主要知识点包括:数据库系统体系架构的发展;并行数据库体系架构;分布式数据库体系架构;实例分析大数据管理系统。1.教学目标1)了解数据库系统体系结构的发展2)了解并掌握并行数据库体系架构3)了解并掌握分布式数据库体系架构4)实例分析现代大数据管理系统本章教学支持的课程目标为目标1和目标3。2.教学重点1)分布式数据管理体系架构理解分布式事务系统结构、分布式并发控制机制,在此基础上及进一步理解分布式数据库设计的折中方案,理解异构与基于云的分布式数据库,理解目录系统。2)现代大数据管理系统实例分析了解大数据管理系统的初步格局NoSQL数据管理技术、MapReduce技术和NewSQL数据库系统。了解Greenplum、YARN、HAWQ、GFS、BigTable、Spanner、ColussuS、F1等当前代表性大数据管系统的架构思想。3.教学难点1)理解分布式事务处理的核心技术首先了解分布式事务的系统结构,理解分布式事务的协调者和参与者的功能;理解分布式事务中全局唯一时间戳、全局等待图等并发控制的原理和技术;在此基础上理解分布式数据库设计的折中的理论依据。②)现代大数据管理系统架构的典型设计思想
1)课堂讨论 围绕图数据结构、图基本操作、图计算典型任务等内容展开。 2)作业 围绕图的定义、查询、更新等内容布置。 3)课外阅读 阅读大数据背景下知识图谱类型数据、图数据引擎、操作语言等方面的相关 学习资料。 4)配套实验 本章的教学内容需要与实验相结合,要求学生能在 Neo4j 图数据库上进行实 际操作,能够正确使用其查询语言,完成相关的数据访问任务需求。为达到教学 效果,实验指导由承担课程教学任务的任课教师承担。 第六章 大数据管理系统的体系架构 主要知识点包括:数据库系统体系架构的发展;并行数据库体系架构;分布 式数据库体系架构;实例分析大数据管理系统。 1.教学目标 1) 了解数据库系统体系结构的发展 2) 了解并掌握并行数据库体系架构 3) 了解并掌握分布式数据库体系架构 4) 实例分析现代大数据管理系统 本章教学支持的课程目标为目标 1 和目标 3。 2.教学重点 1) 分布式数据管理体系架构 理解分布式事务系统结构、分布式并发控制机制,在此基础上及进一步理解 分布式数据库设计的折中方案,理解异构与基于云的分布式数据库,理解目录系 统。 2) 现代大数据管理系统实例分析 了解大数据管理系统的初步格局 NoSQL 数据管理技术、MapReduce 技术和 NewSQL 数据库系统。了解 Greenplum、YARN、HAWQ、GFS、BigTable、Spanner、 Colussus、F1 等当前代表性大数据管系统的架构思想。 3.教学难点 1) 理解分布式事务处理的核心技术 首先了解分布式事务的系统结构,理解分布式事务的协调者和参与者的功能; 理解分布式事务中全局唯一时间戳、全局等待图等并发控制的原理和技术;在此 基础上理解分布式数据库设计的折中的理论依据。 2) 现代大数据管理系统架构的典型设计思想

对于设计上有先后依赖关系的大数据系统,理解其相互之间的联系和区别,理解大数据系统的分布式处理、容错机制、并发控制策略;理解大数据系统从传统数据库到分布式数据库,再到NoSQL数据库,再又发展到NewSQL数据库的演化过程及其中的关键设计思想的变革。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕并行数据库、分布式数据库、当前代表性大数据系统体系架构等内容展开。2)作业围绕数据库并行技术、分布式事务及其并发控制、典型大数据系统架构设计思想等内容布置。3)课外阅读阅读NoSQL、NewSQL数据库的典型系统的相关学习资料。第七章数据组织与存储主要知识点包括:数据组织与存储的嵌套关系;文件系统数据组织;数据组织带来的映射与放大;硬件访问模型;索引技术:键值存储;列存储;其他类型存储。1.教学目标1)理解数据模型、数据存储与数据组织之间的关系:2)掌握主要的存储硬件访问特征:3)熟练掌握主流的索引技术:4)了解常见的键值存储、列存储、文档存储和图存储系统和优化技术。本章教学支持的课程目标为目标1和目标3。2.教学重点1)索引技术理解经典的哈希索引和有序索引的优缺点:理解跳跃表、前缀树等读优化索引的优化思想;理解B树、LSM树等写优化(WOI)索引的优化思想:理解存在索引的原理及其优化意义。2)键值存储掌握基于哈希索引的键值存储系统的基本数据组织策略;掌握基于LSM树索引的键值存储系统的基本数据更新机制;理解基于B/B+树索引的键值存储系统的典型改进策略。3.教学难点1)LSM树索引的组织结构及其数据更新机制
对于设计上有先后依赖关系的大数据系统,理解其相互之间的联系和区别, 理解大数据系统的分布式处理、容错机制、并发控制策略;理解大数据系统从传 统数据库到分布式数据库,再到 NoSQL 数据库,再又发展到 NewSQL 数据库的演 化过程及其中的关键设计思想的变革。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。 1)课堂讨论 围绕并行数据库、分布式数据库、当前代表性大数据系统体系架构等内容展 开。 2)作业 围绕数据库并行技术、分布式事务及其并发控制、典型大数据系统架构设计 思想等内容布置。 3)课外阅读 阅读 NoSQL、NewSQL 数据库的典型系统的相关学习资料。 第七章 数据组织与存储 主要知识点包括:数据组织与存储的嵌套关系;文件系统数据组织;数据组 织带来的映射与放大;硬件访问模型;索引技术;键值存储;列存储;其他类型 存储。 1.教学目标 1) 理解数据模型、数据存储与数据组织之间的关系; 2) 掌握主要的存储硬件访问特征; 3) 熟练掌握主流的索引技术; 4) 了解常见的键值存储、列存储、文档存储和图存储系统和优化技术。 本章教学支持的课程目标为目标 1 和目标 3。 2.教学重点 1) 索引技术 理解经典的哈希索引和有序索引的优缺点;理解跳跃表、前缀树等读优化索 引的优化思想;理解 B ε树、LSM 树等写优化(WOI)索引的优化思想;理解存在 索引的原理及其优化意义。 2) 键值存储 掌握基于哈希索引的键值存储系统的基本数据组织策略;掌握基于 LSM 树索 引的键值存储系统的基本数据更新机制;理解基于 B/B+树索引的键值存储系统 的典型改进策略。 3.教学难点 1) LSM 树索引的组织结构及其数据更新机制

理解LSM对于日志型数据的良好适应性;理解LSM树的分层策略及其读优化意义;理解存在索引对于优化LSM树读操作的必要性。2)典型的兼职存储系统的数据组织策略掌握一致性hash算法:理解RAMCloud系统在哈希索引基础上的日志及其容错机制;理解基于LSM树的键值存储系统的数据读写机制。4.教学环节设计围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。1)课堂讨论围绕存储RUM原理、索引技术、键值存储系统等内容展开。2)作业围绕索引技术、键值存储机制等内容布置。3)课外阅读阅读一致性哈希、LSM日志合并树等典型大数据管理系统的数据组织与存储技术相关学习资料。第八章分布式查询处理优化主要知识点包括:分布式查询处理的基本原理,数据分布的基本策略,分布式查询处理的基本方法:分片策略与查询处理之间的相互关系,分布式查询处理的主要影响因素:分布式关系数据库查询处理的执行过程,分布式查询处理的四个阶段及处理方法典型案例:集中式与分布式查询优化的基本技术;当前代表性的分布式关系数据库、NoSQL数据库的主要特点和查询处理技术。1.教学目标1)了解分布式查询处理的基本原理;2)了解数据分片策略及对如何影响分布式查询处理实现技术:3)了解分布式查询处理的执行方法;4)了解当代表分布式系统查询处理方法:本章教学支持的课程目标为目标1和目标3。2.教学重点1)关系数据库的分布式查询处理掌握几种分片策略,理解分片策略与查询处理的关系:理解分布式查询处理的影响因素:掌握分布式查询处理分解的四个步骤:理解数据局部化:掌握查询存取优化和局部优化的基本方法。2)分布式关系数据库查询处理技术实例分析理解Teradata分布式查询优化技术:理解MemSQL分布式查询优化技术;了解新型分布式关系数据库的查询优化技术。3.教学难点
理解 LSM 对于日志型数据的良好适应性;理解 LSM 树的分层策略及其读优化 意义;理解存在索引对于优化 LSM 树读操作的必要性。 2) 典型的兼职存储系统的数据组织策略 掌握一致性 hash 算法;理解 RAMCloud 系统在哈希索引基础上的日志及其容 错机制;理解基于 LSM 树的键值存储系统的数据读写机制。 4.教学环节设计 围绕教学重点和教学难点,综合应用课堂讨论、作业、课外阅读等教学形式。 1)课堂讨论 围绕存储 RUM 原理、索引技术、键值存储系统等内容展开。 2)作业 围绕索引技术、键值存储机制等内容布置。 3)课外阅读 阅读一致性哈希、LSM 日志合并树等典型大数据管理系统的数据组织与存储 技术相关学习资料。 第八章 分布式查询处理优化 主要知识点包括:分布式查询处理的基本原理,数据分布的基本策略,分布 式查询处理的基本方法;分片策略与查询处理之间的相互关系,分布式查询处理 的主要影响因素;分布式关系数据库查询处理的执行过程,分布式查询处理的四 个阶段及处理方法典型案例;集中式与分布式查询优化的基本技术;当前代表性 的分布式关系数据库、NoSQL 数据库的主要特点和查询处理技术。 1.教学目标 1) 了解分布式查询处理的基本原理; 2) 了解数据分片策略及对如何影响分布式查询处理实现技术; 3) 了解分布式查询处理的执行方法; 4) 了解当代表分布式系统查询处理方法; 本章教学支持的课程目标为目标 1 和目标 3。 2.教学重点 1) 关系数据库的分布式查询处理 掌握几种分片策略,理解分片策略与查询处理的关系;理解分布式查询处理 的影响因素;掌握分布式查询处理分解的四个步骤;理解数据局部化;掌握查询 存取优化和局部优化的基本方法。 2) 分布式关系数据库查询处理技术实例分析 理解 Teradata 分布式查询优化技术;理解 MemSQL 分布式查询优化技术;了 解新型分布式关系数据库的查询优化技术。 3.教学难点