D0I:10.13374/j.issn1001-053x.1999.0M.022 第21卷第4期 北京科技大学学报 Vol.21N0.4 1999年8月 Journal of University of Science and Technology Beijing Aug.1999 图像数据库的智能检索 吴斌12)王秉钦” 1)北京科技大学信息工程学院,北京1000832)西南工学院信控系,四川绵阳,621002 摘要提出了以人工智能思想为指导的图像数据库的智能检索方法,它利用模式识别技术 和图像处理技术,同时考虑启发性知识.该方法用图像特征向量代表图像并进行聚类分析以建 立图像库的检索树,应用最佳优先搜索方法在检索树上找出用户满意的图像,重点探讨了如何 利用专家的经验知识和通过样本训练得到启发评价函数,并推出了启发评价函数存在的条件. 关键词图像数据库:智能检索:聚类;评价函数 分类号TP392 随着人们对信息重要性的不断提高,日益广义关键子图),并对其规范化以形成图像的特 迫切要求建立支持图像处理、图像管理、图像推 征向量;其次在特征向量的基础上应用模式识 理、图像存储、图像通讯以及图像输入/输出的 别技术中的聚类分析方法建立适合于智能检索 集成化图像信息系统,图像信息系统的核心是 的检索树,即对特征向量进行组织,也即将图像 图像数据库(Image Database-IDB),它是图像技 库按树形结构组织.在检索时,采用启发式深度 术与数据库技术相结合的产物,其任务是提供 优先的搜索策略进行树搜索,根据启发函数的 有效地管理图像数据和快速地交互图像信息的 值确定检索树上每层各节点的优先权,选取优 手段. 先权最大的节点逐层向下搜索,直到叶子节点 检索是衡量数据库系统性能优劣的重要标 找到所要检索的图像为止:若到叶子节点仍找 志之一.现有IDB中的检索操作,是根据图像的 不到目标,则逐层回溯再搜索其他的分枝 属性,如图像名、制作日期、作者等利用表格式 的查询语言对整个图像库进行检索~引,类似于 2特征提取 传统数据库的检索.它的不足有: 在图像中存在着一些特殊的信息,这些信 (1)盲目地对整个图像库进行检索.当图像 息使该图像有别于其他任何图像,它们就是图 量较大时,需要较长的检索时间:(2)要求用户 像的特征,这些特征包含在图像的内容中,当 熟悉查询语言:(3)检索信息不涉及图像本身所 然,从广义上讲,图像的特征还包括有图像的属 含的内容,且要求有确切的检索信息, 性,如图像名、图像作者、制作日期等,但本文研 因此,有必要研究一种新的检索方法,能够 究中所指图像特征不包含这些属性,图像的特 快速准确方便地从浩如烟海的图像数据库中检 征是多种多样的,如点特征、局部特征、整体特 索出用户所需的图像,在用户提供的检索信息 征、幅度特征、直方图特征、变换系数特征等, 不充分的情况下也能进行检索,并且向用户所 从一幅图像中提取出什么样的特征需结合 提供的检索信息不仅应包含图像的属性,而更 有关领域知识,根据建库者所关心的问题来决 多和更重要的是应包含图像本身的内容. 定,特征提取的方法也与图像所反映的对象物 1基本思想 体的各种物理的、形态的性能有很大的关系, 从一幅图像中可提取的特征常常不是惟一的, 首先应用图像处理技术从图像中抽取出能 而是多种多样的,故需对它们进行规范化处理, 完全惟一表征此图像的特征信息(称为图像的 即特征选择,以选出最合适和最有代表性的特 征组成图像的特征向量.目前特征提取方法大 1998-10-06收稿吴斌男,33岁,博士 致分为二类:以最小错误概率条件下的特征提第 卷 第 期 年 月 北 京 科 技 大 学 学 报 心 图像数据库 的智能检索 吴 斌 ’, 王 秉钦 ” 北京科技大学信息工程学院 , 北京 西南工学院信控系 , 四川绵阳 , 摘 要 提 出 了 以人 工 智 能 思想 为指导 的 图像数据库 的智 能检索方法 , 它利用 模式 识别 技术 和 图像处理技术 , 同时考虑 启 发性知识 该方法用 图像特征 向量代表 图像并进 行聚类分析 以建 立 图像库的检索树 , 应用最佳优先搜索方法在检索树上 找 出用户满意 的图像 重 点探讨 了如何 利用专家的经验 知识和 通过样 本训练得到启 发评价函数 , 并推 出 了启发评价 函 数存在 的条件 关键词 图像数据库 智 能检索 聚类 评价 函数 分 类号 随着人 们 对 信 息重 要 性 的不 断提 高 , 日益 迫 切 要 求 建立 支持 图像处 理 、 图像管理 、 图像推 理 、 图像存储 、 图像通 讯 以及 图像输入 输 出 的 集成化 图像信息系统 图像信息 系统 的核心 是 图像数据 库 一 , 它 是 图像技 术 与数据 库技术相 结合 的产 物 , 其任 务是 提供 有效地 管理 图像数据和 快速地 交互 图像信息 的 手 段 检索是 衡量数据 库 系统性 能优劣 的重 要标 志 之 一 现有 中的检索 操 作 , 是 根据 图像 的 属性 , 如 图像名 、 制作 日期 、 作 者 等利用 表 格式 的查询 语 言对 整 个 图像库进行检索 〔 ‘ 一 ” , 类似于 传 统数据 库 的检索 它 的不 足 有 盲 目地对 整 个 图像库进行检 索 当 图像 量 较 大 时 , 需 要 较 长 的检 索 时 间 要 求 用 户 熟悉查询语 言 检索信息 不涉及 图像本身所 含 的 内容 , 且 要 求有确 切 的检索信 息 因此 ,有必 要 研 究一 种新 的检索方法 , 能 够 快速准确方便地 从浩如烟海 的 图像数据库 中检 索 出用 户 所需 的 图像 , 在 用 户 提 供 的检 索 信 息 不 充分 的情况 下 也 能进行检 索 , 并且 向用 户所 提 供 的检索信息不 仅应 包 含 图像 的属 性 , 而 更 多和 更 重 要 的是应 包含 图像 本 身的 内容 广 义关键子 图 , 并对其规 范化 以形成 图像的特 征 向量 其 次在特 征 向量 的基础 上应用 模式识 别技术 中的聚类分析方法建立适合 于 智 能检索 的检索树 , 即对特征 向量进行组织 , 也 即将 图像 库 按树形 结构组 织 在 检索时 , 采用 启发式深度 优 先 的搜索策 略进 行树 搜索 根 据启发 函数 的 值 确 定 检索树上 每层 各 节 点 的优 先 权 , 选取 优 先 权最 大 的节 点逐层 向下 搜索 , 直 到 叶子 节 点 找 到所 要检索 的 图像为止 若到 叶子 节 点仍 找 不 到 目标 , 则逐 层 回溯 再 搜 索 其他 的分 枝 基本思想 首先应用 图像处 理 技术从 图像 中抽取 出 能 完全惟一 表征 此 图像 的特 征 信 息 称 为 图像 的 一 一 收稿 昊斌 男 , 岁 , 博士 特征提取 在 图像 中存在着一 些特 殊 的信 息 , 这 些信 息 使该 图像有 别 于 其他任何 图像 , 它 们 就 是 图 像 的特 征 这 些特 征 包 含 在 图像 的 内容 中 当 然 , 从广义上 讲 , 图像 的特征还包括有 图像 的属 性 , 如 图像名 、 图像作者 、 制作 日期等 , 但本文研 究中所 指 图像特 征不包 含这些 属 性 图像 的特 征 是 多种 多样 的 , 如 点特 征 、 局 部特 征 、 整 体特 征 、 幅度 特 征 、 直方 图特 征 、 变换 系 数特 征 等 从 一 幅 图像 中提取 出什么 样 的特征需结合 有 关 领 域知 识 , 根据 建库者 所关心 的 问题来决 定 特征提取 的方法 也 与图像所 反映的对 象物 体 的各种物理 的 、 形 态 的性 能有很 大 的关系 从 一 幅 图像 中可 提 取 的特 征常 常不 是惟 一 的 , 而 是 多种多样的 , 故需对 它们进行规 范化处理 , 即特 征选 择 , 以选 出最 合适 和 最 有代表 性 的特 征 组 成 图像 的特 征 向量 目前特 征 提 取方 法 大 致 分 为二 类 以最 小错 误 概率条件 下 的特 征 提 DOI :10.13374/j .issn1001-053x.1999.04.022