第14讲多媒体数据库技术 第6章多媒体数据库与超文本技术 61MDBS体系结构 611MDBS的研究内容 612MDBS的层次结构 62多媒体数据模型 621层次一关系(H-R)模型 622对象一关系(O-R)模型 △基于内容的检索 6.3.1基于内容检索系统的体系结构 632基于内容检索的关键技术
第14讲 多媒体数据库技术 第6章 多媒体数据库与超文本技术 6.1 MDBS体系结构 6.1.1 MDBS的研究内容 6.1.2 MDBS的层次结构 6.2 多媒体数据模型 6.2.1 层次-关系(H-R)模型 6.2.2 对象-关系(O-R)模型 △基于内容的检索 6.3.1 基于内容检索系统的体系结构 6.3.2 基于内容检索的关键技术
第6章多媒体数据库与超文本技术 传统数据库:只能处理以文字方式表达的单一媒体信息; 不能适应多种媒体信息的综合处理要求 多媒体数据库:需处理文本、图形图像、动画、视频、音频等 多种媒体信息;乃至超文本和超媒体信息 一涉及许多新思想、新技术和新方法; 是支撑多媒体应用的关键技术之 6MDBS体系结构 611MDBS的研究内容 1.多媒体数据管理 基本内容:数据分类,组织,编码,存储,检索,维护
第6章 多媒体数据库与超文本技术 传统数据库:只能处理以文字方式表达的单一媒体信息; 不能适应多种媒体信息的综合处理要求 多媒体数据库:需处理文本、图形、图像、动画、视频、音频等 多种媒体信息;乃至超文本和超媒体信息 — 涉及许多新思想、新技术和新方法; 是支撑多媒体应用的关键技术之一 6.1 MDBS体系结构 6.1.1 MDBS的研究内容 1.多媒体数据管理 基本内容:数据分类,组织,编码,存储,检索,维护
1)数据分类:数据类抽象为数据类型;关系数据,媒体数据 2)数据组织:数据形式描述,数据结构定义,数据类型定义等 文件系统一描述非格式化数据(文图声文件结构) 数据库系统一描述格式化数据如关系型数据结构) (3)数据编码:数据的代码表示形式;数据项代码,数据流代码 (4)数据存储:以存储介质构成的物理存储环境与设备管理.如 逻辑设备管理,物理设备管理;虚拟存储管理 (5)数据检索:数据提供查询与使用.主要内容包括, 存取路径定位,存取方法定义,存取权限管理,SQL接口等 核心问题:数据表现机制,检索算法,时空同步机制 (6)数据维护:对基本数据结构和数据使用过程的管理与控制 如库结构修改,记录一致性维护,分布更新,备份与转贮
(1)数据分类:数据类抽象为数据类型;关系数据,媒体数据 (2)数据组织:数据形式描述,数据结构定义,数据类型定义等 文件系统 — 描述非格式化数据(文图声文件结构) 数据库系统 — 描述格式化数据(如关系型数据结构) (3)数据编码:数据的代码表示形式;数据项代码,数据流代码 (4)数据存储:以存储介质构成的物理存储环境与设备管理.如 逻辑设备管理,物理设备管理;虚拟存储管理 (5)数据检索:数据提供查询与使用.主要内容包括, 存取路径定位,存取方法定义,存取权限管理,SQL接口等 核心问题:数据表现机制,检索算法,时空同步机制 (6)数据维护:对基本数据结构和数据使用过程的管理与控制 如库结构修改,记录一致性维护,分布更新,备份与转贮
2. MDBMS的功能特征 (1)多媒体数据表示:符合MMUI技术规范的基本要求 多数据类型和多交互方式的统一界面表示; 多用户/多视图的透明存取操作;独立于数据存储结构 (2)多媒体数据存取:取决于所采用的数据模型 a.层次/网状/关系/超文本/面向对象模型 b.数据元模型(原子特性)/信息元模型(复合语义关系) C.时序模型/空间结构模型 数据存取能力主要表现为: ①具有支持多数据类型的数据结构 ②具有支持多交互方式的数据操作模型 ③具有支持多数据源分布与透明存取的数据完整性约束
2. MDBMS的功能特征 (1)多媒体数据表示:符合MMUI技术规范的基本要求 多数据类型和多交互方式的统一界面表示; 多用户/多视图的透明存取操作;独立于数据存储结构 (2)多媒体数据存取:取决于所采用的数据模型 a.层次/网状/关系/超文本/面向对象模型 b.数据元模型(原子特性)/信息元模型(复合语义关系) c.时序模型/空间结构模型 数据存取能力主要表现为: ① 具有支持多数据类型的数据结构 ② 具有支持多交互方式的数据操作模型 ③ 具有支持多数据源分布与透明存取的数据完整性约束
(3)多媒体数据管理:系统/并发/完整性控制.关键问题 ①大对象存储管理与存取方法(如Text, Image, Binary) ②长事务处理能力 ③变长字段类型支持(如 Sybase,最大长度为2G字节) ④基于内容的检索(如图像形状或颜色;声音的语义) )多媒体数据库维护:数据库更新,索引重组, 库结构与字典维护,数据复制与转贮,版本管理等 (5)MMDB的网络通信:联机事务处理,并发与远程存取, 关系数据与超文本数据之间的信息交换,信息集成接口 (6)方法库支持:引入方法库思想及智能建模规则, 以实现多媒体数据的有效分解、组合和变换操作, 建立基于规则和标准算法的方法库,从而提高库管理效率
(3)多媒体数据管理:系统/并发/完整性控制.关键问题 ①大对象存储管理与存取方法(如Text,Image,Binary) ②长事务处理能力 ③变长字段类型支持(如Sybase,最大长度为2G字节) ④基于内容的检索(如图像形状或颜色;声音的语义) (4)多媒体数据库维护:数据库更新,索引重组, 库结构与字典维护,数据复制与转贮,版本管理等 (5)MMDB的网络通信:联机事务处理,并发与远程存取, 关系数据与超文本数据之间的信息交换,信息集成接口 (6)方法库支持:引入方法库思想及智能建模规则, 以实现多媒体数据的有效分解、组合和变换操作, 建立基于规则和标准算法的方法库,从而提高库管理效率
612MDBS的层次结构 1.总体框架设计思想 (1)层次划分:多媒体应用层; MDBMS层;多媒体数据源 ①多媒体应用层:CAI,CSCW,视频会议,点播电视VOD ② MDBMS层:定义了整个MMDB框架体系结构的核心功能; 包括数据模型,存取方法,完整性约束,数据同步等 ③多媒体数据源:用于描述数据存取与信息交换的数据资源 源数据库和源文件;用户数据及类型;库位置及连接信息 2)实现策略 ①每个功能层构成一个虚拟机,完成对下层的共性抽象, 并掩盖下层模块的实现细节;供上层模块调用 ②每个功能层可作子层分解,直至对象单元;乃至构件化
6.1.2 MDBS的层次结构 1.总体框架设计思想 (1)层次划分:多媒体应用层;MDBMS层;多媒体数据源 ①多媒体应用层:CAI,CSCW,视频会议,点播电视VOD ② MDBMS层:定义了整个MMDB框架体系结构的核心功能; 包括数据模型,存取方法,完整性约束,数据同步等 ③多媒体数据源:用于描述数据存取与信息交换的数据资源 源数据库和源文件;用户数据及类型;库位置及连接信息 (2)实现策略 ① 每个功能层构成一个虚拟机,完成对下层的共性抽象, 并掩盖下层模块的实现细节;供上层模块调用 ② 每个功能层可作子层分解,直至对象单元;乃至构件化
2. MDBMS总体功能描述(关键和难点) (1)多媒体应用界面表示层:人机交互→可视化人一人交互 ①静态交互:窗口,按钮,菜单,文本输入域,热字 ②动态交互:移动对象,限次响应,限时响应,条件响应 主要功能: ①用户数据存取的外观设计表现(一致性交互界面) ②通用API或用户自定义界面表示(如MsQL) ③基于HTM和ⅫM文档格式的数据浏览支持 (2)多媒体数据视图定义层 ①为应用界面提供外模式或子模式级的专用视图描述 ②为集成服务提供中性的逻辑视图描述与格式转换 一③为概念模式提供语言编译、完整性检查和存取优化机制
2.MDBMS总体功能描述(关键和难点) (1)多媒体应用界面表示层:人机交互 → 可视化人-人交互 ① 静态交互:窗口,按钮,菜单,文本输入域,热字 ② 动态交互:移动对象,限次响应,限时响应,条件响应 主要功能: ① 用户数据存取的外观设计表现(一致性交互界面) ② 通用API或用户自定义界面表示(如MSQL) ③ 基于HTML和XML文档格式的数据浏览支持 (2)多媒体数据视图定义层 ① 为应用界面提供外模式或子模式级的专用视图描述 ② 为集成服务提供中性的逻辑视图描述与格式转换 ③ 为概念模式提供语言编译、完整性检查和存取优化机制
(3)多媒体数据存取操作层:寻求一致性操作规范 ①操作模式:a.常规操作:排序,选择,査找;插删改 b.图像编辑:缩放,平移,旋转,覆盖,拼接,裁剪 c.声音编辑:声音合成,参数调整,A/V同步 d.数据压缩编码/实时解码处理 实现思路:多元组的集合操作→单纪录的对象操作 ②子层分解:a基本存取层;提供对设备和文件的I/0操作 b.媒体存取层:提供各种单媒体的数据流存取操作 C.分布对象存取层:多种媒体合并为单媒体对象的特定操作 ③存取路径定义要求:a.基于空间位置寻址的存取路径 b.基于时间点/时间段的时序数据流存取路径 C基于内容与相似查询的存取路径一
(3)多媒体数据存取操作层:寻求一致性操作规范 ① 操作模式:a.常规操作:排序,选择,查找;插删改 b.图像编辑:缩放,平移,旋转,覆盖,拼接,裁剪 c.声音编辑:声音合成,参数调整,A/V同步 d.数据压缩编码/实时解码处理 实现思路:多元组的集合操作 → 单纪录的对象操作 ② 子层分解:a.基本存取层:提供对设备和文件的I/O操作 b.媒体存取层:提供各种单媒体的数据流存取操作 c.分布对象存取层:多种媒体合并为单媒体对象的特定操作 ③ 存取路径定义要求:a.基于空间位置寻址的存取路径 b.基于时间点/时间段的时序数据流存取路径 c.基于内容与相似查询的存取路径
④存取算法: a传统查询方法:B树,B+树,倒排表,Hash变换 b.多维空间索引算法:R树,R*树,SR树,P树,MP树 ⑤并发控制:使多用户多场地协同事务的集合操作串行化 a封锁法及事务等待机制一用于冲突频繁的操作 b乐观法及事务回退机制用于冲突较少的操作 ⑥实现过程: a.确定数据映射到系统缓冲区逻辑页面上的记录编址方式; 以及编址前对数据进行压缩与实时解压的处理算法 b.提供快速有效的存取路径 C.采用高效的搜索算法和虚拟存储页面管理技术 d进行DM语义扩充,如使S扩充为MSQL;以扩充接口能力
④ 存取算法: a.传统查询方法:B树,B+树,倒排表,Hash变换 b.多维空间索引算法:R树,R *树,SR树,VP树,MVP树 ⑤ 并发控制:使多用户多场地协同事务的集合操作串行化 a.封锁法及事务等待机制 — 用于冲突频繁的操作 b.乐观法及事务回退机制 — 用于冲突较少的操作 ⑥ 实现过程: a.确定数据映射到系统缓冲区逻辑页面上的记录编址方式; 以及编址前对数据进行压缩与实时解压的处理算法 b.提供快速有效的存取路径 c.采用高效的搜索算法和虚拟存储页面管理技术 d.进行DML语义扩充,如使SQL扩充为MSQL;以扩充接口能力
(4)多媒体数据存储组织层:存储对象一针对数据源 ①库组织策略:a.关系数据库:存放格式化的常规数据 b.媒体库:存放非格式化的复杂数据(文图声) C.特征库:存放输入或自动提取的内容特征信息及其参数 d.方法库:存不同数据类型或语义间的变换规则与通用算法 e.知识库:存放基于领域知识分析的智能推理算法 ②主要功能:a.数据页定义与存储分配 (逻辑页/缓冲区组织;外存上数据分配) b.系统缓冲区管理:读/写管理,页面更新,数据迁移等 C.内外存数据交换与外存管理:数据块预装入与内存分配; 交互命令模式控制;外存设备上的数据转储与复制 d.各种数据源/库之间的同步触发控制与动态连接
(4)多媒体数据存储组织层:存储对象 — 针对数据源 ① 库组织策略:a.关系数据库:存放格式化的常规数据 b.媒体库:存放非格式化的复杂数据(文图声) c.特征库:存放输入或自动提取的内容特征信息及其参数 d.方法库:存不同数据类型或语义间的变换规则与通用算法 e.知识库:存放基于领域知识分析的智能推理算法 ② 主要功能:a.数据页定义与存储分配: (逻辑页/缓冲区组织;外存上数据分配) b.系统缓冲区管理:读/写管理,页面更新,数据迁移等 c.内外存数据交换与外存管理:数据块预装入与内存分配; 交互命令模式控制;外存设备上的数据转储与复制 d.各种数据源/库之间的同步触发控制与动态连接