第12章XM技术
第12章 XML技术
本章的重要概念 (1)从SGML、HTML到XML的发展,XML文档 DTD(文档类型定义)、ⅩML模式,XML数据 库的存取方法 (2)XML查询语言 XQUERY的基本功能、基本 概念,简单查询的表达,各种类型查询的表达, 复杂查询的表达 (3)基于关系数据库XML的处理,XML存储和 查询系统体系结构,XML数据到关系数据库的 存储映射,基于关数据库的XML查询
本章的重要概念 (1)从SGML、HTML到XML的发展,XML文档、 DTD(文档类型定义)、XML模式,XML数据 库的存取方法。 (2)XML查询语言XQUERY的基本功能、基本 概念,简单查询的表达,各种类型查询的表达, 复杂查询的表达。 (3)基于关系数据库XML的处理,XML存储和 查询系统体系结构,XML数据到关系数据库的 存储映射,基于关数据库的XML查询
本章概述 ●随着因特网的快速发展,ⅫM(可扩展标记语言 eXtensible Markup language)不仅作为 Internet上的 种数据发布语言出现,同时作为数据交换语言,正应 用于其它很多领域如数据交换、标准定一等。同时XML 数据的各种存储与查询的技术也日益成熟,在XML查询 语言、XM数据的存储方法、査询代数、查询优化和索 引技术方面等方面出现很多研究成果和成熟方法,绝大 多数数据库管理系统厂商均在它们的产品中增加了对 ⅪM数据处理的模块,同时也出现了专门针对XML数据的 存储系统,并应用在很多实际系统中
本章概述 ⚫ 随着因特网的快速发展,XML(可扩展标记语言, eXtensible Markup Language)不仅作为Internet上的 一种数据发布语言出现,同时作为数据交换语言,正应 用于其它很多领域如数据交换、标准定一等。同时XML 数据的各种存储与查询的技术也日益成熟,在XML查询 语言、XML数据的存储方法、查询代数、查询优化和索 引技术方面等方面出现很多研究成果和成熟方法,绝大 多数数据库管理系统厂商均在它们的产品中增加了对 XML数据处理的模块,同时也出现了专门针对XML数据的 存储系统,并应用在很多实际系统中
主要内容 ⅩML概述 常用的ⅩML查询语言: QUERY 基于关系数据库的ⅩML处理
主要内容 ⚫ XML概述 ⚫ 常用的XML查询语言:XQUERY ⚫ 基于关系数据库的XML处理
XML概述 ●从SGML、HTML到XML XM是SGML的一个子集,它试图将HTML的简单性与SGML 的强大功能结合起来。XM的设计目的明确地定位为万 维网上的应用。设计工作基于两个重要的准则:易于编 写处理XML的计算机程序,以及人和系统能花费极少的 代价将HTML移植到XM中 1996年W3C正式成立XML工作组。1998年2月,XML1.0被 W3C正式确认为W3C推荐标准。其特点为: XML可直接在因特网上使用 XML应支持广泛的应用 使用方便,结构简明 表达能力强,适于计算机进行处理
XML概述 ⚫ 从SGML、HTML到XML ⚫ XML是SGML的一个子集,它试图将HTML的简单性与SGML 的强大功能结合起来。XML的设计目的明确地定位为万 维网上的应用。设计工作基于两个重要的准则:易于编 写处理XML的计算机程序,以及人和系统能花费极少的 代价将HTML移植到XML中。 1996年W3C正式成立XML工作组。1998年2月,XML1.0被 W3C正式确认为W3C推荐标准。其特点为: ⚫ XML可直接在因特网上使用 ⚫ XML应支持广泛的应用 ⚫ 使用方便,结构简明 ⚫ 表达能力强,适于计算机进行处理
XML、DTD与 XML Schema 一个X文档由序言和文档实例两个部分组成。序言包 括一个XM声明和一个文档类型声明,二者都是可选的 文档类型声明由DTD定义,它定义了文档类型结构。序 言之后是文档实例,它是文档的主体,它是DTD的一个 实现。 XML文档中最重要的组件是元素( element)。每个元 素都有一个类型,类型声明可以放在文档内部或放在外 部DTD文件中。元素可能具有一组属性(称为属性列 表),每个属性说明有属性名和属性值类型。在文档中, 用开始标记和结束标记<>来确定元素的边界。 元素之间的包含关系是一种树型结构。一个XM文档就 是一棵有根、有序、带标记的树
XML、DTD与XML Schema ⚫ 一个XML文档由序言和文档实例两个部分组成。序言包 括一个XML声明和一个文档类型声明,二者都是可选的。 文档类型声明由DTD定义,它定义了文档类型结构。序 言之后是文档实例,它是文档的主体,它是DTD的一个 实现。 ⚫ XML文档中最重要的组件是元素(element)。每个元 素都有一个类型,类型声明可以放在文档内部或放在外 部DTD文件中。元素可能具有一组属性(称为属性列 表),每个属性说明有属性名和属性值类型。在文档中, 用开始标记和结束标记来确定元素的边界。 元素之间的包含关系是一种树型结构。一个XML文档就 是一棵有根、有序、带标记的树
个XM文档 K?xml version=1.0 encoding="IS0-8859-1?> Natanya lastname>Pitts/lastname> K /author> Price> $25
一个XML文档 XML技术内幕 Natanya Pitts $25
个XML文档 其中的book.dtd为 K!ARRLIST BOOK year CDATA #REQUIRED> ELEMENT lastname(#PCDATA)>
一个XML文档 其中的book.dtd为:
XM数据库 纯粹的XM存取方法:它是专门针对XM格式文档进行存 取管理和数据操作的数据库,数据库中的数据和元数据 完全采用XM结构表示,其底层针对XM数据的特点,采 用相应的存储结构,而不是采用现有的数据存储工具 基于关系数据库的存取方法:它是在关系数据库基础之 上扩展了XM支持模块,它将ⅫM数据存储在关系数据库 中,在査询时将ⅪM数据査询语言转换成关系数据数据 库查询语言。 返
XML数据库 ⚫ 纯粹的XML存取方法:它是专门针对XML格式文档进行存 取管理和数据操作的数据库,数据库中的数据和元数据 完全采用XML结构表示,其底层针对XML数据的特点,采 用相应的存储结构,而不是采用现有的数据存储工具。 ⚫ 基于关系数据库的存取方法:它是在关系数据库基础之 上扩展了XML支持模块,它将XML数据存储在关系数据库 中,在查询时将XML数据查询语言转换成关系数据数据 库查询语言。 返 回
常用的XM查询语言: XQUERY ●例12.3查询每本书的作者人数以及每位作者的名字,语句为: Results> FOR$ book IN//book//指定变量$book的取值范围是结点 LET authors Sbook/author //把变量$ authors赋值为$book的子结点 RETURN FOR Author In Authors RETURN Author> Author/last/textoauthor> S/ results
常用的XML查询语言:XQUERY ⚫ 例12.3 查询每本书的作者人数以及每位作者的名字,语句为: { FOR $book IN //book //指定变量$book的取值范围是结点 LET $authors := $book/author //把变量$authors赋值为$book的子结点 RETURN { FOR $author IN $authors RETURN { $author/last/text() } } }