D0I:10.13374/j.issn1001-053x.1999.0M.022 第21卷第4期 北京科技大学学报 Vol.21N0.4 1999年8月 Journal of University of Science and Technology Beijing Aug.1999 图像数据库的智能检索 吴斌12)王秉钦” 1)北京科技大学信息工程学院,北京1000832)西南工学院信控系,四川绵阳,621002 摘要提出了以人工智能思想为指导的图像数据库的智能检索方法,它利用模式识别技术 和图像处理技术,同时考虑启发性知识.该方法用图像特征向量代表图像并进行聚类分析以建 立图像库的检索树,应用最佳优先搜索方法在检索树上找出用户满意的图像,重点探讨了如何 利用专家的经验知识和通过样本训练得到启发评价函数,并推出了启发评价函数存在的条件. 关键词图像数据库:智能检索:聚类;评价函数 分类号TP392 随着人们对信息重要性的不断提高,日益广义关键子图),并对其规范化以形成图像的特 迫切要求建立支持图像处理、图像管理、图像推 征向量;其次在特征向量的基础上应用模式识 理、图像存储、图像通讯以及图像输入/输出的 别技术中的聚类分析方法建立适合于智能检索 集成化图像信息系统,图像信息系统的核心是 的检索树,即对特征向量进行组织,也即将图像 图像数据库(Image Database-IDB),它是图像技 库按树形结构组织.在检索时,采用启发式深度 术与数据库技术相结合的产物,其任务是提供 优先的搜索策略进行树搜索,根据启发函数的 有效地管理图像数据和快速地交互图像信息的 值确定检索树上每层各节点的优先权,选取优 手段. 先权最大的节点逐层向下搜索,直到叶子节点 检索是衡量数据库系统性能优劣的重要标 找到所要检索的图像为止:若到叶子节点仍找 志之一.现有IDB中的检索操作,是根据图像的 不到目标,则逐层回溯再搜索其他的分枝 属性,如图像名、制作日期、作者等利用表格式 的查询语言对整个图像库进行检索~引,类似于 2特征提取 传统数据库的检索.它的不足有: 在图像中存在着一些特殊的信息,这些信 (1)盲目地对整个图像库进行检索.当图像 息使该图像有别于其他任何图像,它们就是图 量较大时,需要较长的检索时间:(2)要求用户 像的特征,这些特征包含在图像的内容中,当 熟悉查询语言:(3)检索信息不涉及图像本身所 然,从广义上讲,图像的特征还包括有图像的属 含的内容,且要求有确切的检索信息, 性,如图像名、图像作者、制作日期等,但本文研 因此,有必要研究一种新的检索方法,能够 究中所指图像特征不包含这些属性,图像的特 快速准确方便地从浩如烟海的图像数据库中检 征是多种多样的,如点特征、局部特征、整体特 索出用户所需的图像,在用户提供的检索信息 征、幅度特征、直方图特征、变换系数特征等, 不充分的情况下也能进行检索,并且向用户所 从一幅图像中提取出什么样的特征需结合 提供的检索信息不仅应包含图像的属性,而更 有关领域知识,根据建库者所关心的问题来决 多和更重要的是应包含图像本身的内容. 定,特征提取的方法也与图像所反映的对象物 1基本思想 体的各种物理的、形态的性能有很大的关系, 从一幅图像中可提取的特征常常不是惟一的, 首先应用图像处理技术从图像中抽取出能 而是多种多样的,故需对它们进行规范化处理, 完全惟一表征此图像的特征信息(称为图像的 即特征选择,以选出最合适和最有代表性的特 征组成图像的特征向量.目前特征提取方法大 1998-10-06收稿吴斌男,33岁,博士 致分为二类:以最小错误概率条件下的特征提
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 心 图像数据库 的智能检索 吴 斌 ’, 王 秉钦 ” 北京科技大学信息工程学院 , 北京 西南工学院信控系 , 四川绵阳 , 摘 要 提 出 了 以人 工 智 能 思想 为指导 的 图像数据库 的智 能检索方法 , 它利用 模式 识别 技术 和 图像处理技术 , 同时考虑 启 发性知识 该方法用 图像特征 向量代表 图像并进 行聚类分析 以建 立 图像库的检索树 , 应用最佳优先搜索方法在检索树上 找 出用户满意 的图像 重 点探讨 了如何 利用专家的经验 知识和 通过样 本训练得到启 发评价函数 , 并推 出 了启发评价 函 数存在 的条件 关键词 图像数据库 智 能检索 聚类 评价 函数 分 类号 随着人 们 对 信 息重 要 性 的不 断提 高 , 日益 迫 切 要 求 建立 支持 图像处 理 、 图像管理 、 图像推 理 、 图像存储 、 图像通 讯 以及 图像输入 输 出 的 集成化 图像信息系统 图像信息 系统 的核心 是 图像数据 库 一 , 它 是 图像技 术 与数据 库技术相 结合 的产 物 , 其任 务是 提供 有效地 管理 图像数据和 快速地 交互 图像信息 的 手 段 检索是 衡量数据 库 系统性 能优劣 的重 要标 志 之 一 现有 中的检索 操 作 , 是 根据 图像 的 属性 , 如 图像名 、 制作 日期 、 作 者 等利用 表 格式 的查询 语 言对 整 个 图像库进行检索 〔 ‘ 一 ” , 类似于 传 统数据 库 的检索 它 的不 足 有 盲 目地对 整 个 图像库进行检 索 当 图像 量 较 大 时 , 需 要 较 长 的检 索 时 间 要 求 用 户 熟悉查询语 言 检索信息 不涉及 图像本身所 含 的 内容 , 且 要 求有确 切 的检索信 息 因此 ,有必 要 研 究一 种新 的检索方法 , 能 够 快速准确方便地 从浩如烟海 的 图像数据库 中检 索 出用 户 所需 的 图像 , 在 用 户 提 供 的检 索 信 息 不 充分 的情况 下 也 能进行检 索 , 并且 向用 户所 提 供 的检索信息不 仅应 包 含 图像 的属 性 , 而 更 多和 更 重 要 的是应 包含 图像 本 身的 内容 广 义关键子 图 , 并对其规 范化 以形成 图像的特 征 向量 其 次在特 征 向量 的基础 上应用 模式识 别技术 中的聚类分析方法建立适合 于 智 能检索 的检索树 , 即对特征 向量进行组织 , 也 即将 图像 库 按树形 结构组 织 在 检索时 , 采用 启发式深度 优 先 的搜索策 略进 行树 搜索 根 据启发 函数 的 值 确 定 检索树上 每层 各 节 点 的优 先 权 , 选取 优 先 权最 大 的节 点逐层 向下 搜索 , 直 到 叶子 节 点 找 到所 要检索 的 图像为止 若到 叶子 节 点仍 找 不 到 目标 , 则逐 层 回溯 再 搜 索 其他 的分 枝 基本思想 首先应用 图像处 理 技术从 图像 中抽取 出 能 完全惟一 表征 此 图像 的特 征 信 息 称 为 图像 的 一 一 收稿 昊斌 男 , 岁 , 博士 特征提取 在 图像 中存在着一 些特 殊 的信 息 , 这 些信 息 使该 图像有 别 于 其他任何 图像 , 它 们 就 是 图 像 的特 征 这 些特 征 包 含 在 图像 的 内容 中 当 然 , 从广义上 讲 , 图像 的特征还包括有 图像 的属 性 , 如 图像名 、 图像作者 、 制作 日期等 , 但本文研 究中所 指 图像特 征不包 含这些 属 性 图像 的特 征 是 多种 多样 的 , 如 点特 征 、 局 部特 征 、 整 体特 征 、 幅度 特 征 、 直方 图特 征 、 变换 系 数特 征 等 从 一 幅 图像 中提取 出什么 样 的特征需结合 有 关 领 域知 识 , 根据 建库者 所关心 的 问题来决 定 特征提取 的方法 也 与图像所 反映的对 象物 体 的各种物理 的 、 形 态 的性 能有很 大 的关系 从 一 幅 图像 中可 提 取 的特 征常 常不 是惟 一 的 , 而 是 多种多样的 , 故需对 它们进行规 范化处理 , 即特 征选 择 , 以选 出最 合适 和 最 有代表 性 的特 征 组 成 图像 的特 征 向量 目前特 征 提 取方 法 大 致 分 为二 类 以最 小错 误 概率条件 下 的特 征 提 DOI :10.13374/j .issn1001-053x.1999.04.022
Vol.21 No.4 吴斌等:图像数据库的智能检索 ·397 取和按准则的特征提取(如熵方法、K-L变换、 特征向量是它的下层子节点所组成类别的族 最佳鉴别变换等)” 心, 在研究中,我们利用“积分投影”方法提取 按照定义2,可以确定聚类树上所有非叶子 人脸图像的特征点侧.但因各特征点是彼此弧立 节点的类特征向量,从而保证树上每一个节点 的,不能形象、直观地表征人脸,所以采用点间 都有一个特征向量或类特征向量,这样聚类树 的某种组合构成人脸的特征向量.共选择15个 就成为一棵便于检索的检索树了. 点间的距离或夹角作为人脸特征向量的各个分 在我们的实验中,检索树是用Lisp语言编 量.这些点的选择原则是:分量数目尽可能少: 写的,可按如下2种定义来表示检索树, 各分量间的相关性小:各分量的方差Y大,而对 定义3检索树上每个节点对应着Lisp语 应的噪声方差σ2小,使品质因素6=(2-σ)1σ高. 言中的一个原子,每个原子的性质表中增加3 项性质:①性质Vector项,其值为用表表示的对 3建立检索树 应节点的特征向量或类特征向量:②性质Suc- 图像库中的每幅图像都有其相应的特征向 cessor项,其值为该节点的子节点对应的原子组 成的表.若此项性质为空L,则表明此节点为 量,对它们应用聚类分析的方法进行聚类分析, 将图像库按树形结构重新组织,以建立起适合 叶子节点(对应着图像):③性质Precedence项, 其值为父辈节点对应的原子,当该项值为NL 于智能检索的检索树. 时,说明此原子对应的节点为根节点. 聚类算法选用具有一定启发性的最大最小 (MAXMIN)距离算法例.MAXMIN算法是以欧氏 定义4检索树用一张嵌套表来表示,其定 义如下:①若检索树为空,则用空表NL表示; 距离为基础的一个启发式聚类算法,它实质上 分为两大步骤:寻找聚类中心和将模式样本按 ②若检索树只有一个节点L,则用表(L)表示:③ 对检索树上任意一个节点N,其子节点设为S, 最近距离分到最近的聚类中心 S,S,则可表示为: 设共有n个图像特征向量S,S,…,S,经过 (N.(S)S)S)) 一次聚类分析后,得到m,个子类,其中第i个聚 其中N,或为根节点,或为另一棵更大检索树上 类类别中含N,个特征向量,三N=m:再应用聚 的子类节点,S,S,S,是同一父辈节点的兄弟节 类方法对这个m,个子类进行聚类分析,得到m: 点,它们可能是叶子节点,也可能是另外子树的 个子类(>m>m),其中第j个类别中含有Ng个 父辈节点,其表示如①,②,③所定义的形式. 子类,三N=m.如此聚类下去,直到只得到一 这2种方式各有优缺点.前者结构简单,操 个子类,即产生根节点R,形成一棵如图1所示 作方便,但当检索树非常庞大时,占有较多存贮 的聚类树为止.该树上的叶子节点为S2(p=1,2, 空间:而后者的结构紧凑,节省存储空间,但在 …,),是各图像的特征向量,对应着图像库中的 检索树较大时,由于嵌套层次较多,给操作带来 各图像. 麻烦,运算时间长.我们选用后一种方式,即用 定义1聚类树上各非叶子节点,称为子类 嵌套表表示检索树, 节点,它们的特征向量称为类特征向量 定义2聚类树第k层上的某子类节点的类 R 图1聚类树
一 一 吴斌 等 图像数 据 库 的智 能检 索 一 取 和 按准 则 的特 征提 取 如嫡 方 法 、 一 变换 、 最 佳 鉴别 变换等 「一 〕 在研 究 中 , 我们 利用 “ 积 分 投 影 ” 方 法 提取 人脸 图像的特征 点‘ 但 因各特征 点是 彼 此 弧立 的 , 不 能形 象 、 直 观 地表 征 人 脸 , 所 以采 用 点 间 的某种组 合 构成 人脸 的特 征 向量 共选择 巧 个 点 间的距 离或夹 角作 为人脸特征 向量 的各个分 量 这 些 点 的选择 原 则 是 分 量 数 目尽 可 能少 各分 量 间 的相 关 性小 各分 量 的方 差尹大 , 而 对 应 的噪声方差了 小 , 使品质 因素 占 尹一 护 扩 高 建立检索树 图像库中的每幅 图像都有 其相应 的特 征 向 量 , 对它们 应用聚类分析的方法进行聚类分析 , 将 图像库按 树形 结构重 新组 织 , 以建立起 适合 于 智 能检索的检索树 聚类算法选用具有一 定启发性 的最大最 小 呵 距离算法 叭 算法是 以欧 氏 距 离为基础 的一个启发式聚 类算法 , 它 实质上 分 为 两 大步骤 寻 找聚类 中心和 将模式样 本 按 最 近距离分到最近 的聚 类 中心 设共有 个 图像特征 向量 , 凡 , … , 凡 , 经 过 一 次聚类分析后 , 得 到 ,个子 类 , 其 中第 个 聚 类类 别 中含 凡 ‘个特 征 向量 , 蓦凡产 ” 再 应用聚 类方法对 这个 , 个子类进行 聚类分析 , 得 到 狡 个子类 , 其 中第 个类别 中含 有 个 子类 , 全 一 如 此聚 类 下 去 , 直 到 只 得 到一 个子类 , 即产生根节 点 , 形 成 一 棵如 图 所 示 的聚 类树为止 该树上 的叶子 节 点为 凡勿 ,, … , , 是各 图像的特征 向量 , 对应着 图像库 中的 各 图像 定 义 聚类树上 各 非叶子 节 点 , 称 为 子 类 节 点 , 它们 的特征 向量称为类特 征 向量 定义 聚类树第 层 上 的某子 类节 点 的类 特 征 向量 是 它 的 下 层 子 节 点 所 组 成 类 别 的族 心 按照 定义 , 可 以确 定聚类树上 所有 非 叶子 节 点的类特 征 向量 , 从而 保证树上 每一 个 节 点 都 有 一 个 特 征 向量或 类特征 向量 , 这 样聚 类树 就 成为一 棵便于 检索 的检索树 了 在 我 们 的实验 中 , 检索树是 用 语 言编 写 的 , 可 按 如 下 种 定 义 来表 示检 索树 定义 检索树上 每个节 点对应 着 语 言 中的一 个 原子 , 每个 原子 的性质表 中增 加 项 性 质 ①性 质 项 , 其值 为用 表表 示 的对 应 节 点 的特 征 向量 或 类特 征 向量 ②性质 项 , 其值 为该 节 点 的子 节 点对 应 的原子 组 成 的表 若 此项性质 为 空 , 则表 明此 节 点为 叶 子节 点 对 应着 图像 ③性质 项 , 其值 为父 辈节 点对 应 的原 子 当该项值 为 时 , 说 明此 原子 对 应 的节 点为根 节 点 定义 检 索树用 一 张 嵌套表来表 示 , 其 定 义 如下 ①若检索树为 空 , 则用 空表 表示 ②若检索树 只 有一 个 节 点 , 则 用表 表 示 ③ 对 检索树上 任意一 个节 点凡 ,, 其子节 点设为 ,, 又 , 凡 , 则可 表示 为 凡 , 凡 其 中凡 ,或 为根节 点 , 或为另一 棵更 大检索树上 的子 类节 点 , , 及 , 凡 是 同一 父 辈节 点 的兄 弟节 点 , 它们 可 能是 叶子 节 点 , 也 可 能是另外 子 树 的 父 辈节 点 , 其表示 如① , ② , ③所 定义 的形 式 这 种方式各 有优缺点 前 者 结构 简单 , 操 作方便 , 但 当检索树非常庞 大时 , 占有 较 多存贮 空 间 而 后 者 的结构紧凑 , 节 省存储 空 间 , 但 在 检索树较 大 时 , 由于 嵌套层 次较 多 , 给 操 作带 来 麻烦 , 运算 时 间长 我们 选 用 后 一 种方 式 , 即用 嵌套表 表 示检 索树 从 , 川 一 凡 。 又 , 凡 凡 凡 凡 图 聚类树
·398· 北京科技大学学报 1999年第4期 4启发式搜索算法研究 子节点,即找到满意的图像为止· 4.2算法的修改 在图像库中检索一幅图像就是在检索树上 在上面的由样本集训练求取启发评价函数 从根节点或从某一类节点(中间节点)开始搜索 h(a,b)的算法中存在如下的不足:①用k个样本 满足用户要求的叶子节点(即图像).我们采用 节点对求取权矢量W时,选用不同的k个样本 启发式搜索技术进行树搜索,其关键在于启发 节点对所求得的权矢量W可能不同.②即使选 评价函数的确定, 用了一个W,它也只是由k个相应的样本节点 41启发评价函数的构造 对求出来的.因此,这时的W也只是对这k个样 设检索树上任一节点a,其子节点之一为b, 本节点对的h(a,b)是最小均方差估计,对剩余 则二者间的启发评价函数构造为: 的样本节点对不一定也是这样. h(a,b)=wo+w (a,b)+wzf (a,b)+.+wf (a,b)(1) 专家经验的可贵之处就在于其对某些特例 其中,w,为权系数,i=0,1,2,…,n;a,b)为节点对 有独到的推理方式,因此启发式搜索中的启发 (a,b)间的第j个联系特征值,广=1,2,…,n:n为联 评价函数h(a,b)应根据这样的经验来获取, 系特征的个数. 定义5任选图像库中的一幅图像,在检索 联系特征f(a,b)的选择应根据检索树上的 树上找出从其对应的叶子节点开始逐层向上直 特征向量或类特征向量的表示形式与内容来确 到根节点的所有分枝,称这些分枝为优先枝,即 定.在人脸图像库中,检索树上的特征向量是15 目标所在路径上的分枝为优先枝,而检索树上 维的向量,因此各节点间最简单的联系特征是: 相应的其他分枝称为非优先枝 节点对应向量间的夹角、距离、对应分量之差与 对检索树上的所有节点对按下述三原则指 和等.对于一组给定的样本节点对集{(a,b)},根 导专家凭经验给定评价值h(a,b). 据专家经验可给出一组评价值h(a,b).将专家 原则1若节点对(a,b)在优先枝上,则 的定性经验定量化就是用h(a,b)尽可能的逼近 h(a,b)0,为正值. h*(a,b),即确定的h(a,b)必须使下述均方估值 原则2若节点对(a,b)在优先枝上,h(a,b), (MS)最小: 则随着深度增大(即离根节点越远)而减小,即 MS=E(h'(a,b)-[wo+wih(a,b)+wzf (an,b)+ h(a,b)更负;否则,h(a,b)增大,即更正. …+wn(a,b)]}2 (2) 原则3在同一层上的各非优先枝上的节点 其中k为样本节点对数.在MS中,h*(a,b)和 对(a,b)的h(a,b)基本上相同. f(a,b,)为已知,只有权系数w0=0,1,…,n)未知. 在检索树上任选k个节点对由式(4)求出权 由变分法可知,MS最小时,应满足条件: 矢量W,并代入式(1)得到启发评价函数h(a,b). aMS9/aw,=0j=0,l,…,n (3) 按下面的方法利用剩余的样本节点对对权矢量 定义4个矩阵F,H,H*,W如下. W进行修正,即修正启发评价函数h(a,b). 联系特征矩阵F: 对于剩余的节点对(a,b0=k+1…L;L为所 「1f(a,b)5(a,bi)…f(a,b)l [FT(a,b) 有的节点对数),若h(ab)与h(a,b)同号,则不 1f(a2,b,)5(a,b)…f6(a,b,) F(a2,b2) F- 用修正权矢量W,否则按如下方法修改权矢量 】… 4 W.令 1 f(a,ba)f (asb)..(as,b)F(a,b) a=[h(a,b)-h(a,b,】0≤≤1(由经验选定). 启发评价函数矢量H和评价值矢量H: 设修正后的权矢量为W,修正后的启发评 H=[h(a,b)h(az,b2)..h(as,ba)]. 价函数为h(a,b),则W'=W+aFa,b), H=[h(a,bi)h'(a,b)…h'(a,b)]'. h'(ab)=h(a,b)+aF(ab). 权矢量W:W=[wo,w,…,w]I.根据矩阵运算求得: 可证明h《a,b)比h(a,b)更为接近h'(a,b,). W=(FT.F)·FT·f (4) 最后重新对所有的节点对进行迭代检查其 H=F.W (5) h(a,b)与h(a,b,)是否同号,若异号则进行修正, 由式(4)就可求出W,进而就确定了启发评 直到所有的节点对都满足h(a,b)与h'(a,b)同号 价函数h(a,b).当启发评价函数确定后,在检索 为止,从而就确定了权矢量W,也就决定了启发 时总是沿着h(a,b)最优的支路进行检索直到叶
· 北 京 科 技 大 学 学 报 年 第 期 启发式搜索算法研究 在 图像库 中检索一 幅 图像就 是 在检索树上 从根节 点或 从某一 类节 点 中 间节 点 开 始搜索 满足用 户 要 求 的叶 子 节 点 即 图像 我们 采 用 启 发式搜索技术进 行 树搜索 , 其 关 键在 于 启 发 评价 函数 的确 定 启 发评价函数的构造 设检索树上任一节 点 , 其子节 点之一 为 , 则二 者 间 的启发评 价 函 数构造为 , 厂 , 诱 , … 抓 , 其 中 , ,为权系数 , , , , … , 双, 为节 点对 , 间 的第 个联 系特 征值 , , , … , 为联 系特 征 的个数 联 系特征芳 , 的选择应根据检索树 上 的 特征 向量或类特征 向量 的表 示 形 式 与 内容来确 定 在人脸 图像库中 , 检索树上 的特征 向量 是 巧 维 的 向量 , 因此各 节点 间最简单 的联系特征是 节 点对应 向量 间 的夹 角 、 距 离 、 对应分量之 差 与 和 等 对于 一 组给定 的样本节 点对集 ,, , 根 据 专 家 经 验 可 给 出一 组 评价 值 山, 将 专 家 的定性经 验 定量化 就是 用 口, 尽 可 能 的逼 近 , , 即确 定 的 , 必 须 使下 述均方估值 最 小 艺 ‘ ,, 护 一 。 厂 , ‘ 抓 ‘, ‘ … 琳苏 风 , ’ 其 中 为样 本节 点对 数 在 中 , , , , 和 芳 ,〕为 已 知 , 只 有 权 系数 玛仃二 , ,… , 未 知 由变分法可 知 , 最 小时 , 应满足条件 刁 习 , ,… , 定义 个矩 阵 , , 月 , 砰 如 下 … 联系特 征矩 阵 厂 , 关 ,, , … 不 , , 厂 , 关 , … 不 仇 , 厂 , 关,,办 … 不 , 尸 , 尸 伪 , 尸 , 启 发 评 价 函数 矢 量 和 评价值矢量 ‘ 万二 , , … 诀力 ’ 【 ’ ,, ’ , … ‘ 仇 , 〕 权矢量 琪 环任 , , … , 磷 根据矩阵运算求得 、产、, 了、 了 以︸ 声 ‘ 、 尸 尸 · 刀七 一 , · 尸 · 矿 甲 由式 就 可 求 出 琳 进而 就确 定 了启发评 价 函 数 , 当启 发 评价 函 数 确 定后 , 在检索 时总是沿着 口 , 最 优 的支路 进行检索直到 叶 子节 点 , 即 找到满 意 的 图像 为止 算法 的修改 在上 面 的 由样 本集训 练求取启 发 评 价 函 数 , 的算法 中存在如下 的不足 ①用 个样本 节 点对求取权矢量 甲 时 , 选用 不 同 的 个样本 节 点对所求得 的权矢量 牙可 能不 同 ② 即使选 用 了一个 矶 它也只 是 由 个相应 的样本节 点 对 求 出来 的 因此 , 这 时 的 牙也 只 是对这 个样 本节 点对 的 , 是最 小均方差 估计 , 对剩余 的样本节 点对不 一 定也 是 这样 专家经验 的可 贵之 处 就在 于 其 对 某些特例 有独 到 的推理 方式 , 因此 启发式搜索 中的启发 评价 函 数 , 应 根据 这 样 的经验 来获取 定义 任选 图像库 中的一 幅 图像 , 在检索 树上 找 出从 其对应 的叶子节 点 开 始逐层 向上 直 到根节 点 的所有分枝 , 称这些分 枝为优先枝 即 目标所在路径 上 的分枝 为优先 枝 , 而检 索树上 相 应 的其他分 枝称 为非 优先 枝 对 检索树上 的所 有节 点对按下 述三原则指 导专 家凭经 验给定评 价值 ’ , 原 则 若 节 点 对 , 在 优 先 枝 上 , 则 ’ , , 为 负值 否 则 ’ , , 为正 值 原 则 若节 点对 , 在优先 枝上 , ’ , , 则随 着深 度增大 即离根节 点越远 而 减小 , 即 ‘ , 更 负 否 则 , ’ , 增大 , 即更 正 原 则 在 同一层 上 的各 非优 先枝上 的节 点 对 , 的 ’ , 基 本上 相 同 在检 索树上 任选 个节 点对 由式 求 出权 矢 量 砰 , 并代入 式 得 到启 发评价 函 数 , 按下 面 的方法利用剩余 的样 本节 点对 对权矢 量 附 进行 修正 , 即 修正 启 发 评 价 函 数 , 对 于 剩余 的节 点对 ,,分 十 卜 · 工工 为所 有 的节 点对 数 , 若 , 与 ’ ,助 同号 , 则不 用修正 权矢 量 砰 , 否 则按如下 方法 修改权矢 量 跳 令 又 ,,,一 , 」 ‘ 又‘ 由经验 选定 设修正 后 的权矢量 为 甲 , 修正 后 的启发评 价 函 数为 ,’ , 则 甲 牙 口爪, , , , 马 , 回马 , , 可证 明 丫,动 比 ,, 更 为接近 ’ ,动 最 后 重新对所有 的节 点对进行迭代检查 其 ,, 与 ’ , 是否 同号 , 若异号则进行修正 , 直到所有 的节点对都满足 , 与 厅 ,, 同号 为止 , 从而 就确定 了权矢量 邢 , 也就 决定 了启 发
VoL21 No.4 吴斌等:图像数据库的智能检索 ·399· 评价函数h(4,b). 其中:hi=h(a,b;f=f(a,b); 4.3算法收敛性的证明 b,=-2Σ[h-Ef6w,lf 在前面给出的启发评价函数的修正算法中 ri=n+2,…s),可取任何正值或零 还存在最后一个问题:此修正算法是否收敛,即 故只要确定的联系特征矩阵F和专家凭经 能否找到满足要求的启发评价函数, 验给定的评价值矢量H满足上述的三条件,则 对h(a,b)的要求有两点:①对所有样本节点 由样本训练求权矢量W的修正算法就收敛,即 对都有h(a,b)与h(a,b)同号:②ha,b)是h 就能找到满足要求的启发评价函数h(a,b). (a,b)的最小均方误差估计.这两点用数学式描 述就是: 5结论 h(a,b)·h(a,b)=h(a,b)·(Ufw)20 (6) 本文所提出的图像数据库的智能检索方 Σ[h'(a,b)-h(a,b)]/k= 法,其检索信息是来自于图像本身所包含的信 三[ha.b小-三后wk-min (7) 息,而不是按图像主题词(属性)进行检索,从而 (6)式中的“=”是考虑到h(a,b)可能有零, 具有了重要的实际应用意义.口如公安科学中 方为F中第i行第j列元素.其中,而=1. 使用刑事犯图像文本数据库、指纹库等都提出 在式(6,(⑦)中,除权系数州,是未知量外,其 了这样的要求,即由图像信息(人像、指纹图案) 余都是已知.因此如果能从这两式中求得非零 来检索所需的对象.同时,该方法中所提出的通 的权矢量W,那么相应的h(a,b)就是满足要求 过样本训练进行自学习以得到启发评价函数的 的,亦即修正算法是收敛的.于是上面所提问题 方法,不仅可以用在图像数据库的智能检索中, 就是一个如下的非线性规划问题 还可应用在存在推理过程的任何领域, 目标函数:minw)-=2[h(a,b》-三新w水, 参考文献 约束条件:g(m=h(a,b》三w≥0. I Boursier P.Image Data Bases:A Status Report,Computer Architecture for Pattern Analysis and Image Database 其中,i=1,2,…,k应用非线性规划理论可以求得 Management.Managment,1985.355 权矢量W非零解存在的条件如下.条件1:在确 2 Nick Roussopoulos,Christos Faloutsos,Timos Sellis.An 定节点对间的联系特征时,必须保证目标函 Efficient Pictorial Database System for PSQL.IEEE 数的海赛矩阵(Hessian matrix)H正定或半正定, Trans on Software Engineering,1988,14(5):639 条件2:联系特征矩阵F的行向量应线性无关, 3 Thomas Joseph,Alfonso F.Cardenas:A High Level Query Language for Pictoria FI Database Management.IEEE 即k个样本节点对的联系特征向量应不成比例, Trans on Software Engineering,1988,14(5):630 条件3:设约束条件中有5个条件为零,其余条 4 Movgera S D,Datta L.Toward a Fundamental Theory of 件大于零,即 Optimal Feature Selection:Part I.IEEE Pattern Anal And g1(W=0,g(W0=0,…,g(=0, Mach Intell 1984,PAMI-6(5):601 g*()>0,g2(W)>0,…,g(W刚>0. 5 Malina W.Some Multiclass Fisher Feature Selector Algo- 则当s≤n+1时,必须满足: rithms and Their comparison with K-L Algorithm.Pattern fo hifao…f。1-Hfb。 Recognition Letter,1987,6(5):279 6 Sammon J W.An Optimal Discriminate Plane.IEEE hifi…h6 b 20. Trans Computer,1970,C-19:826 7 Marinovic N M,Eichmann G.Feature Extraction and Pat- hif-1h5.-t…a-n」b-小 tern Classification and in Space-spatial Frequency Do- 当s>n+1时,必须满足: main.Proc SPIE,1985,579:19 b。- 所fr 8郑坚平,尤婉英标准正面人脸图像的识别计算机工程, [hifo hif0…hrfo 1992,18(1):1 hfih…ho-vm b-空石 9李介谷,蔡国廉计算机模式识别技术上海:上海交通大 2 ≥0. 学出版社,1986.1 hf hifin…hivu b-三hhn (下转第402页)
吴 斌等 图像数据库 的智 能检索 一 评价 函 数 ’,, 算法收敛性的证 明 在前面给 出 的启 发 评 价 函数 的修正 算法 中 还存在最 后一个 问题 此修正 算法 是否 收敛 , 即 能否 找到满足要 求 的启 发评 价 函 数 对 , 的要求有两点 ①对 所 有样本节 点 对 都 有 ,, 与 ’ ,, 同 号 ② ,, 是 ’ , 的最 小均 方 误 差 估 计 这 两 点用 数 学式 描 述 就 是 ’ ,, , · ,, 〕 ‘ ,, , · 艺饥 七 其 中 ’ ,, 厂 芳, ,, , 一 艺【 一 艺无 · 〕苏 神 少旬 , ,… , , 可 取任何 正 值 或零 故 只 要 确定 的联 系特征矩 阵 和 专家凭经 验 给 定 的评 价值矢量 ’ 满 足上 述 的三 条件 , 则 由样本训 练求权矢 量 尸 的修正 算法 就收敛 , 即 就 能找到满足要 求 的启发评价 函数 , 艺〔 ’ ‘, 〕一 , , 加 影’ ,,。一三无 一 式 中的 “ ” 是考虑到 ,, 可 能有零 , 九为 中第 行第 列元素 其 中 ,儿 在式 , 中 , 除权系数 琳 是未知量外 , 其 余 都是 已知 因此如果 能从这两 式中求得非零 的权矢 量 甲 , 那 么 相 应 的 , 就 是满足要 求 的 , 亦 即修正算法是收敛的 于是上面所提 问题 就 是 一 个如下 的非线性规划 问题 目标 函 数 以 ’ ,助一 艺石 · 」,, 卜 了司 约 束条件 ,以叻 一 ”,, 属无 ’ ‘ ” · 其 中 , , , , 应用非 线性规划 理 论可 以求 得 权矢量 甲非零解 存在 的条件如下 条件 在确 定节 点对 间 的联系特征关 时 , 必 须 保证 目标 函 数的海赛矩 阵 琳 正 定或半正 定 条件 联 系特征矩 阵 的行 向量 应 线性无 关 , 即 个样本节 点对 的联系特征 向量应不成 比例 条件 设约束条件 中有 个条件 为零 , 其 余条 件 大于 零 , 即 哟 , 乡 哟 , … , 以 哟 , 乡 哟 , 肋 哟 , … , 以哟 则 当 ‘ 时 , 必 须满足 结论 本 文 所 提 出 的 图像 数 据 库 的 智 能检 索 方 法 , 其检索信 息是来 自于 图像本身所包 含 的信 息 , 而 不 是按 图像主 题词 属性 进行检索 , 从而 具有 了重 要 的实际 应 用 意义 口 如 公 安科 学 中 使用 刑事犯 图像文本数据库 、 指纹 库等都提 出 了这样 的要 求 , 即 由 图像信息 人像 、 指纹 图案 来检索所需的对象 同时 , 该方法 中所提 出 的通 过样本训 练进行 自学 习 以得到启 发评价 函 数 的 方法 , 不 仅可 以用在 图像数据库 的智能检索 中 , 还 可 应用 在存在推理 过 程 的任何领 域 参 考 文 献 , , , , , , , , , , 月 , , 一 一 , , , , 一 , 一 , , 郑坚平 ,尤婉英 标准正面人脸图像的识别 计算机工程 , , 李介谷 ,蔡国廉 计算机模式识别技术 上海 上海交通大 学出版社 , 一 场︸ 阮… 儿,力 挑川 嗡碌 ︸ 际厂淤 嗡 当 时 , 必 须 满 足 曰︶ 一 , 力 寿苏 乙片 , ︸艺 儿 一 , 川训日 口办人 … 票井 ,, … 翁儿 , , 儿 ,艺 一 … 牛弄 , 抓︸ ,几刀‘ 切认︸ 刀 ,九力 ,力 下 转第 页
·402· 北京科技大学学报 1999年第4期 按照式(18)给出的各个电流的比例关系, 情况下,当转矩为额定时,转子的全电流等于额 分别控制各电流值,就可以使双馈电动机的铜 定的有功电流ia·由式(10)可知:2=c0sp, 损达到最小.计算表明,对于500kW~3.5MW 对于功率为500kW~3.5MW的感应电动机, 的电动机,按上述比例控制各电流,铜损可以减 在额定转矩时,采用这种控制方式可以使转子 少额定铜损的15%一30%. 电流降低9%~12%, 还有一种令人感兴趣的控制方式,这就是 参考文献 使双馈电动机转子电流最小的控制方式.这种 控制方式的实际意义,不仅在于降低感应电动 1王克成,李则民双馈电动的微型机矢量控制系统.电气 传动,1985,6:10 机的铜损铁损,节约能量减小温升,而且可以减 2章名涛.电机学.北京:科学出版社,1964.88 轻转子侧交一交变频器和整流变压器的负担,3汤蕴堡.电机学一机电能量转换.北京:机械工业出版 换句话说,如果保持转子电流为感应电动机的 社,1982.151 设计值,则可以提高双馈感应电动机的出力.在 4贺益康.交流电机的计算机真,北京:科学出版社, 1990.28 双馈电动机中,定子磁通基本不变,当转子侧功 5土谷武士,江上正.现代制御工学,东京:产业图书出 率因数等于1时,转子电流达到最小值.在这种 版社,1991.178 Three Optimal Control Methods of Double-Fed Motor Wang Kecheng".Yu Datai 1)Auto-control Department,Anshan instituteof Iron and steel Technology,Anshan 114002,China 2)Information Engineering School,UST Beijing,Beijing 100083,China ABSTRACT With simplifying the mathematics model and optimixing the extreme value,the three optimal control methods to the double channels controlling of double-fed motor are deducted,thesemethods optimize the energy index of double-fed motor speed-controling system. KEY WORDS double-fed motor;vector control;optimal control (上接第399页) Intelligent Retrieval Method of Image Database Wu Bin2, Wang Bingqin 1)Information Engineering School,UST Beijing,Beijing 100083,China 2)Dept.of Information and Control Engineering.SWIT,Mianyang 621002 ABSTRACT Image Database(IDB)is a combination of the traditional database and the image processing techniques.An intelligent retrieval method of image database,which is guided by artificial intelligence,is pre- sented.Pattern recognition and image processing techniques,heuristic knowledge are all taken into consider- ation in this method.This method uses an image feature vector to represent an image and builds a retrieval tree of the image base through clustering to seek the optimal image with best-first search for users on it.How to obtain a heuristic evaluation function by using expert's experience and sample training is focused on.These conditions for the existence of evaluation function is presented as well. KEY WORD image database;intelligent retrieval;cluster;evaluation function
北 京 科 技 大 学 学 报 年 第 期 按 照 式 给 出 的各个 电流 的 比例 关系 , 分 别 控制各 电流值 , 就 可 以使双馈 电动 机 的铜 损 达 到最 小 计算表 明 , 对于 的电动机 , 按上 述 比例控 制各 电流 , 铜 损可 以减 少 额 定铜 损 的 巧 一 还 有 一 种令人 感 兴 趣 的控制 方 式 , 这 就 是 使双 馈 电动 机转子 电流 最 小 的控制方 式 这种 控 制方 式 的实 际 意 义 , 不 仅在 于 降低 感 应 电动 机 的铜 损铁损 , 节 约 能量减小温升 , 而 且可 以减 轻 转 子 侧 交一交变频 器和 整流变压 器 的 负担 换句 话 说 , 如 果 保持转子 电流 为感 应 电动机 的 设 计值 , 则可 以提高双馈感应 电动机的 出力 在 双馈 电动 机 中 , 定 子磁通基本不 变 , 当转 子侧功 率 因数等于 时 , 转子 电流达 到最 小值 在这 种 情况下 , 当转矩为额定时 , 转子 的全 电流等于额 定 的有功 电流 坛 。 由式 可知 石 几声 振 · 对 于 功率 为 的感应 电动机 , 在额定转矩 时 , 采用这种控制方式可 以使转子 电流 降低 参 考 文 献 王克成 ,李则 民 双馈电动的微型机矢量控制系统 电气 传动 , , 章名涛 电机学 北京 科学出版社 , 汤蕴缪 电机学一 机电能量转换 北京 机械工业 出版 社 , 贺益康 交流 电机的计算机真 北京 科学 出版社 , 土谷武士 , 江上 正 现代制御工学 东京 产业 图书出 版社 , 一 肠 ,, 一 , , , , , , , 一 , 一 一 一 上 接第 页 肠 , ,,, 肠 夸 ,, , , , , , , 勿 , , 如 如 一 , 而