机器感知与模式识别：一种基于对数极坐标变换的快速目标识别算法

团购合买资源类别：文库，文档格式：PDF，文档页数：7，文件大小：1.31MB

第3卷第4期智能系统学报 Vol 3 Ng 4 2008年8月 CAA I Transactions on Intelligent Systems Aug 2008 一种基于对数极坐标变换的快速目标识别算法严江江，丁明跃，周成平 (华中科技大学图像信息处理与智能控制教育部重点实验室，湖北武汉430074) 摘要：在目标识别的过程中，观察目标图像相对于基准目标图像会存在尺度、方向和位置的变化，使得识别速度和准确率降低.针对这一问题，提出了一种快速对数极坐标变换算法，加快了从笛卡儿坐标转换到对数极坐标的过程。通过采用双轴投影相似度分析算法对目标图像进行匹配，进一步加快了识别速度，同时保证了匹配的可靠性.理论分析和试验结果表明，该算法在计算效率和目标识别正确率方面具有较好的性能关键词：对数极坐标变换；目标识别；图像匹配，快速变换中图分类号：TP391.4文献标识码：A文章编号：16734785(2008)04037007 A fast target recogn ition a lgorithm based on LPT YAN Jiang-jiang,D ING M ing-yue,ZHOU Cheng p ing (State Education Comm ission Key Lab for mage Processing and Intelligent Control,Huazhong University of Science and Technolgy, W uhan 430074,China) Abstract:In the course of target recognition,recognition peed and accuracy decreases if the scale,orientation and position of the target mage changes with respect to the reference mage This paper presents a fast lg polar trans- fomation (LPT)algorithm,which speeds up processing fiom Cartesian coordinates to log polar coordinates as well as speeding up mage matching by using a dual-axis pojection algorithm.The new algorithm greatly accelerates tar get recognition and ensures the reliability ofmatches Theoretical analysis and experments showed that thismethod has better perfomance in both recognition speed and accuracy Keywords:bgpolar transfomation;target recognition;mage matching fast transfomation 在图像处理领域，目标识别是一项极其重要的 transfomation,LPT)可以解决这个问题.对数极坐标研究内容，其应用包括机器视觉、成像制导和文字识变换源于人类视觉中视网膜皮层映射关系的研别等.一般的目标识别过程是计算观察图像与基准究]，人们将其广泛应用于目标识别、目标跟踪、图像的相似度，这种方法称之为模板匹配”通常运动检测、脸部检测等领域3)笛卡儿坐标系下目情况下目标图像相对于基准目标图像会发生尺度、标的尺度和旋转变化映射到对数极坐标系，表现为方向、位置的变化，通过对数极坐标变换(log-polar 目标区域的水平和垂直方向的平移，而目标的轮廓收稿日期：2007-12-19 区域保持不变.利用这种特性可以对目标进行匹配基金项目：国家自然科学基金重点资助项目(60135020FF030405). 通信作者：严江江.Email yisaltriver@yahoo com.cn 和识别， 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

第 3卷第 4期智能系统学报 Vol. 3 №. 4 2008年 8月 CAA I Transactions on Intelligent System s Aug. 2008 一种基于对数极坐标变换的快速目标识别算法严江江 ,丁明跃 ,周成平 (华中科技大学图像信息处理与智能控制教育部重点实验室 ,湖北武汉 430074) 摘要 :在目标识别的过程中 ,观察目标图像相对于基准目标图像会存在尺度、方向和位置的变化 ,使得识别速度和准确率降低. 针对这一问题 ,提出了一种快速对数极坐标变换算法 ,加快了从笛卡儿坐标转换到对数极坐标的过程. 通过采用双轴投影相似度分析算法对目标图像进行匹配 ,进一步加快了识别速度 ,同时保证了匹配的可靠性. 理论分析和试验结果表明 ,该算法在计算效率和目标识别正确率方面具有较好的性能. 关键词 :对数极坐标变换 ;目标识别 ;图像匹配 ;快速变换中图分类号 : TP391. 4 文献标识码 : A 文章编号 : 167324785 (2008) 0420370207 A fast target recogn ition algor ithm based on LPT YAN Jiang2jiang, D INGM ing2yue, ZHOU Cheng2p ing ( State Education Comm ission Key Lab for Image Processing and Intelligent Control, Huazhong University of Science and Technology, W uhan 430074, China) Abstract: In the course of target recognition, recognition speed and accuracy decreases if the scale, orientation and position of the target image changes with respect to the reference image. This paper p resents a fast log2polar trans2 formation (LPT) algorithm, which speeds up p rocessing from Cartesian coordinates to log2polar coordinates as well as speeding up image matching by using a dual2axis p rojection algorithm. The new algorithm greatly accelerates tar2 get recognition and ensures the reliability of matches. Theoretical analysis and experiments showed that thismethod has better performance in both recognition speed and accuracy. Keywords: log2polar transformation; target recognition; image matching; fast transformation 收稿日期 : 2007212219. 基金项目 :国家自然科学基金重点资助项目 (60135020FF030405). 通信作者 :严江江. E2mail: yjsaltriver@yahoo. com. cn. 在图像处理领域 ,目标识别是一项极其重要的研究内容 ,其应用包括机器视觉、成像制导和文字识别等. 一般的目标识别过程是计算观察图像与基准图像的相似度 ,这种方法称之为“模板匹配 ”. 通常情况下目标图像相对于基准目标图像会发生尺度、方向、位置的变化 ,通过对数极坐标变换 ( log2polar transformation,LPT)可以解决这个问题. 对数极坐标变换源于人类视觉中视网膜皮层映射关系的研究 [ 122 ] ,人们将其广泛应用于目标识别、目标跟踪、运动检测、脸部检测等领域 [ 325 ] . 笛卡儿坐标系下目标的尺度和旋转变化映射到对数极坐标系 ,表现为目标区域的水平和垂直方向的平移 ,而目标的轮廓区域保持不变. 利用这种特性可以对目标进行匹配和识别

第4期严江江，等：一种基于对数极坐标变换的快速目标别算法 ·371· 通常目标识别算法在速度上都有很高的要求 r In(),0 arctan(y/x).(1) 本文提出了一种新的快速LPT算法，通过减少采样由于图像是离散栅格化表示的，原图像的像素直接点数目和采用查找表方法来减少运算量.在此基础生成对数极坐标LP)图像的输出像素，这无法保证上进一步提出了一种双轴投影相似度分析算法对目 LP图像的像素都能被映射到.本文采用间接重采样标进行匹配识别，通过统计轴向投影量将二维图像法61来获得LP图像的匹配识别转换为一维的轴向投影匹配识别，可同首先设定LP图像的大小，然后计算LP图像中时获得较高的计算效率和较好的正确识别率的点(：)映射到原图像中的点坐标(x以，其计算 1快速识别算法及其实现公式为 x=ep(y·cos0,y=ep(y·sin0,2) 笛卡儿坐标系中的点(x,以映射到对数极坐标最后将(xy以的值取整后赋给(x): 系中的点(r)的计算公式为 (a)原图像 b)LP图像 (©)原图像采样点图图1原始目标图像及其LP图像以及构造LP图像的原图像采样点图 Fig I Input mage,bgpolar mage,and sampling points of input mage to construct the bogpolar mage 本文只针对二值图像进行处理.从图1(c)中 ξ=o·R (5 看到，极坐标原点处的采样最为密集，采样密度沿中如果w=05有S=M5=M,这时号=R2. 心向外围递减，这样LP图像对目标的平移将会相即LPT的运算量减少了一半.实际应用中，S需要计当敏感.将采样原点取在目标形心的位置来消除目算才能得到，但基准图的S是预先知道的，可以通过标平移的影响，物体形心的确定参见文献[7]图1基准图的S估算出的值.考虑到图像是栅格化表 (b)中黑白相间的地方就是图1(a)中目标轮廓区示，(：)为LP图中整数值的坐标，而LP图像的大域在LP平面的映射.在LP图像中，往往只对目标小是事先确定的，则每次计算的输入参数和结果也轮廓感兴趣，因为它反映了目标的形状，而对靠近采是确定的.如果事先使用一个表来记录式2)中的样原点的图像部分则不感兴趣.如果对靠近采样原输入参数和结果，在以后计算的过程中就只需要通点的区域不采样或者少采样，就可以减少LPT的运过输入参数来查找表中对应的结果即可，这样式算量.因此，只对满足式(3)的点作式(2)的变换. (2)中复杂的自然幂函数和三角函数运算就转换成 r≥ 3) 了读取内存地址中内容的操作相当于加法运算，以R代表LP图距离轴长度，M表示原图像中这将大大加快获得LP图像的速度离采样原点最远的距离，S表示目标边界离采样原由于极坐标原点取在目标的形心位置，消除了点最近的距离，则通过式(4)确定：目标平移的影响，因此只需要考虑目标发生尺度和专=n 旋转变化的情况.极坐标系下的点(P,)转换到对 ·R 4) In(M) 数极坐标下的对应点为(x),即r=n(P以.设目标令S=”,其中0≤w<1,则式(4)可写成：的尺度变化因子为k旋转变化因子为中，则(：)发 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

通常目标识别算法在速度上都有很高的要求 , 本文提出了一种新的快速 LPT算法 ,通过减少采样点数目和采用查找表方法来减少运算量. 在此基础上进一步提出了一种双轴投影相似度分析算法对目标进行匹配识别 ,通过统计轴向投影量将二维图像的匹配识别转换为一维的轴向投影匹配识别 ,可同时获得较高的计算效率和较好的正确识别率. 1 快速识别算法及其实现笛卡儿坐标系中的点 ( x, y)映射到对数极坐标系中的点 ( r,θ)的计算公式为 r = ln ( x 2 + y 2 ) ,θ = arc tan ( y / x). (1) 由于图像是离散栅格化表示的 ,原图像的像素直接生成对数极坐标 (LP)图像的输出像素 ,这无法保证 LP图像的像素都能被映射到. 本文采用间接重采样法 [ 6 ]来获得 LP图像. 首先设定 LP图像的大小 ,然后计算 LP图像中的点 ( r,θ)映射到原图像中的点坐标 ( x, y) ,其计算公式为 x = exp ( r) ·cosθ, y = exp ( r) ·sinθ, (2) 最后将 ( x, y)的值取整后赋给 ( r,θ). 图 1 原始目标图像及其 LP图像以及构造 LP图像的原图像采样点图 Fig. 1 Input image, log2polar image, and samp ling points of input image to construct the log2polar image 本文只针对二值图像进行处理. 从图 1 ( c)中看到 ,极坐标原点处的采样最为密集 ,采样密度沿中心向外围递减 ,这样 LP图像对目标的平移将会相当敏感. 将采样原点取在目标形心的位置来消除目标平移的影响 ,物体形心的确定参见文献 [ 7 ]. 图 1 ( b)中黑白相间的地方就是图 1 ( a)中目标轮廓区域在 LP平面的映射. 在 LP图像中 ,往往只对目标轮廓感兴趣 ,因为它反映了目标的形状 ,而对靠近采样原点的图像部分则不感兴趣. 如果对靠近采样原点的区域不采样或者少采样 ,就可以减少 LPT的运算量. 因此 ,只对满足式 (3)的点作式 (2)的变换. r ≥ξ. (3) 以 R 代表 LP图距离轴长度 , M 表示原图像中离采样原点最远的距离 , S 表示目标边界离采样原点最近的距离 ,则 ξ通过式 (4)确定 : ξ = ln (S ) ln (M ) ·R. (4) 令 S =M ω ,其中 0≤ω < 1,则式 (4)可写成 : ξ =ω·R. (5) 如果 ω = 0. 5,有 S =M 0. 5 = M ,这时 ξ= R /2, 即 LPT的运算量减少了一半. 实际应用中 , S需要计算才能得到 ,但基准图的 S是预先知道的 ,可以通过基准图的 S估算出 ξ的值. 考虑到图像是栅格化表示 , ( r,θ)为 LP图中整数值的坐标 ,而 LP图像的大小是事先确定的 ,则每次计算的输入参数和结果也是确定的. 如果事先使用一个表来记录式 ( 2)中的输入参数和结果 ,在以后计算的过程中就只需要通过输入参数来查找表中对应的结果即可 , 这样式 (2)中复杂的自然幂函数和三角函数运算就转换成了读取内存地址中内容的操作 (相当于加法运算 ) , 这将大大加快获得 LP图像的速度. 由于极坐标原点取在目标的形心位置 ,消除了目标平移的影响 ,因此只需要考虑目标发生尺度和旋转变化的情况. 极坐标系下的点 (ρ,θ)转换到对数极坐标下的对应点为 ( r,θ) ,即 r = ln (ρ). 设目标的尺度变化因子为 k,旋转变化因子为ψ,则 ( r,θ)发第 4期严江江 ,等 :一种基于对数极坐标变换的快速目标别算法 ·371·

·372· 智能系统学报第3卷生尺度和旋转变化后的对应点为(，0)，可由式 N (6)计算得到： =2a助 r'=In(k.p)In(k)In(p)In(k)+r. =,明 (7) 0’=0+ 6) 0,f入，)=0 可以看出，目标的尺度变化相当于在距离轴上平移了式中 L入，)= 1,f入，0)>0 n(k)个单位，而目标的旋转变化相当于在角度轴上入∈1,2，R,0∈f1,2,N} 平移了中个单位，图2清晰地表明了这种关系式中：R、N分别代表LP图距离轴和角度轴长度目标的识别通过LPT转化成LP图与基准LP图 f入，)为点八，)的值.在LP图中，目标轮廓右边的目标轮廓的匹配问题.如果在一个场景中存在多个距离轴投影统计量为0，而目标轮廓左边距离轴投待识别目标，则分别对每一个目标进行匹配识别即影统计量为N,从距离轴最大值逆向开始计算距离可.本文基准图为图1(a),基准LP图为图1(b),LP 轴投影，通过0和N这2个阈值就可以分割出目标平面水平方向为距离轴方向，垂直方向为角度轴方轮廓区域，分割完毕即停止计算.如图3所示，图3 向.为了减少目标轮廓提取的计算量，本文提出了一 (a)~(c)上半部分为距离轴投影曲线，下半部分为种逆向距离轴投影分割方法，用T1和t。分别表示LP 通过计算投影统计量分割出来的目标轮廓区域：图在距离轴和角度轴上的投影统计量. (a)尺度和旋转变化目标 6)目标放大1.5倍 (c)目标旋转90° 图像和非目标图像 (d)目标放大1.5倍并旋转225 (e)非日标图像图2尺度和旋转变化对应的对数极坐标变换图 Fig 2 The LPT mage for object's scaling and rotating change 用经典相关匹配算法81是不能直接对分割出则作下一步的相似度计算.其中，W。和W,分别为来的目标轮廓区域进行比较的，需要作一些相应处 LP图和基准LP图的目标轮廓区域宽度，δ为先验理.式2计算时存在坐标取整过程，目标尺度和旋知识，本文中6取值为3为了对目标轮廓区域进行转变化可能会造成目标轮廓区域的采样误差，造成匹配分析并减少计算量，设计了双轴投影相似度分分割出的宽度不一致，如果宽度相差过大，则直接判析算法，首先用式(7)得到目标轮廓区域在距离轴定不是目标.如果满足和角度轴上的投影，再与基准LP图相应投影进行 |Wp·W,|≤8 8) 匹配分析.文献[9对距离轴投影进行相似度分析 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

生尺度和旋转变化后的对应点为 ( r′,θ′) , 可由式 (6)计算得到 : r′= ln ( k·ρ) = ln ( k) + ln (ρ) = ln ( k) + r, θ′=θ+ψ. (6) 可以看出,目标的尺度变化相当于在距离轴上平移了 ln ( k)个单位,而目标的旋转变化相当于在角度轴上平移了ψ个单位,图 2清晰地表明了这种关系. 目标的识别通过 LPT转化成 LP图与基准 LP图的目标轮廓的匹配问题. 如果在一个场景中存在多个待识别目标 ,则分别对每一个目标进行匹配识别即可. 本文基准图为图 1 ( a) ,基准 LP图为图 1 ( b) , LP 平面水平方向为距离轴方向,垂直方向为角度轴方向. 为了减少目标轮廓提取的计算量,本文提出了一种逆向距离轴投影分割方法,用τλ 和τθ分别表示 LP 图在距离轴和角度轴上的投影统计量. τλ = ∑ N θ=1 L (λ,θ) , τθ = ∑ R λ=1 L (λ,θ). (7) 式中 : L (λ,θ) = 0, f (λ,θ) = 0; 1, f (λ,θ) > 0. λ ∈ { 1, 2, …, R },θ∈ { 1, 2, …, N }. 式中 : R、N 分别代表 LP图距离轴和角度轴长度 , f (λ,θ)为点 (λ,θ)的值. 在 LP图中 ,目标轮廓右边距离轴投影统计量为 0,而目标轮廓左边距离轴投影统计量为 N,从距离轴最大值逆向开始计算距离轴投影 ,通过 0和 N 这 2个阈值就可以分割出目标轮廓区域 ,分割完毕即停止计算. 如图 3所示 ,图 3 ( a) ～( c)上半部分为距离轴投影曲线 ,下半部分为通过计算投影统计量分割出来的目标轮廓区域. 图 2 尺度和旋转变化对应的对数极坐标变换图 Fig. 2 The LPT image for object’s scaling and rotating change 用经典相关匹配算法 [ 8 ]是不能直接对分割出来的目标轮廓区域进行比较的 ,需要作一些相应处理. 式 (2)计算时存在坐标取整过程 ,目标尺度和旋转变化可能会造成目标轮廓区域的采样误差 ,造成分割出的宽度不一致 ,如果宽度相差过大 ,则直接判定不是目标. 如果满足 : | W p - W q | ≤δ, (8) 则作下一步的相似度计算. 其中 , W p 和 W q 分别为 LP图和基准 LP图的目标轮廓区域宽度 ,δ为先验知识 ,本文中 δ取值为 3. 为了对目标轮廓区域进行匹配分析并减少计算量 ,设计了双轴投影相似度分析算法 ,首先用式 ( 7)得到目标轮廓区域在距离轴和角度轴上的投影 ,再与基准 LP图相应投影进行匹配分析. 文献 [ 9 ]对距离轴投影进行相似度分析 ·372· 智能系统学报第 3卷

·374· 智能系统学报第3卷将图4(a)进行复制扩展，就得到了基准角度轴匹配曲线，如图4(d)所示.在给定的阈值下，距离轴算，一次N,运算相当于k+22m)+)次和角度轴投影与基准投影均相似，则判定是目标；否基本运算，一次N。运算相当于k+22m+1 则不是.相似度比较算法采用常用的平均绝对差算次基本运算，其中k为计算机中泰勒级数计算到足法，公式定义为够精确时n的取值，则常用LPT算法共需要4k+ 1+w+1 D,=1·∑IN(d-N, (9) m 12m+2)次基本运算，观察图像大小为256× 式中如果是距离轴投影比较，m=min(W,W,),1= 256LP图像9090，取W。=W,=30,0=05.R= 1,2,:Wp,Wg|+1:如果是角度轴投影比较，m= P=90,k取值为15表1为算法的计算效率对比情 W。,I=1,2,W。N。(、N,(分别表示LP图和况.在以上试验条件下，本文LPT算法相对于常用基准LP图的轴向投影量，设定相似度阈值为·，如 LPT算法速度提高了大约3000倍，匹配算法相对于果距离轴和角度轴投影均有min(D,)≤o,则停止常用相关匹配算法速度提高了30倍左右，计算，并认定是目标表1算法的计算效率对比 2算法复杂度与分析 Table 1 The com parison of calculational effic iency 算法基本运算次数要得出识别结果，需4个步骤：1)得到观察图常用LPT算法 12279600 像LP图；2)分割出观察图像LP图中的目标轮廓区本文LPT算法 4050 域：3计算目标轮廓区域在距离轴和角度轴上的投相关匹配识别算法 486090 影统计量：4)与基准LP图作比较本文匹配算法 16351 分别对每步所需计算量进行分析，1)查找表方对于有不同噪声背景的观察图像，生成LP图像法中取内存地址内容运算相当于加法运算，需要时会将噪声带入，如图5(a)~(b),采用填充和去除 (1-ω)·R·P次加法运算；2)计算轴向投影量相当于加法运算，最多需要(1-⊙)·R·P次加法运孤立点的方法可消除噪声的影响，如图5(c)所示算：3)距离轴投影在第2步中已经计算，这一步需用图2(b)~(d)、去除噪声后的图5(c)与基准要W。·P次加法运算；4)由式(9)取极限情况，对距 LP图作相似度计算，结果如表2所示.其中，W,= 离轴投影，需要2·(W。-W,|+1)·min(Wp,W,) 32W,为观察LP图目标轮廓区域宽度，距离轴和角次加法运算和(W。-W。)次乘法运算，对角度轴，度轴的minD)为式(9)计算出来的各自平均绝对需要2·P)·P次加法运算和P次乘法运算：将加差的最小值法和乘法都作为基本运算，则本文算法共需要表2相似度分析 [2(1-o)R+2P+W。+11·P+(1W。+W,|+1)· Table 2 The analysis of si ilrity [2 n in (W,W,)+1次基本运算图序 We 距离轴D, 角度轴D, 图2b) 31 19032 08222 3试验结果与分析图2(c 33 37500 23556 图2(d 之 22188 13444 常用LPT算法是自然幂和三角函数运算组成图5(c 31 33000 26778 的复杂运算，将自然幂函数、正弦函数和余弦函数展开成泰勒级数，分别记为NE、Ns、Nc,根据泰勒展开本文共采用3组不同图像进行了实验.第1组是40张目标作各种尺度和旋转变化的图像，使用最式，一次NE运算相当于k+ 公2m+业次基本运近邻插值方法：第2组是90张加入了各种不同噪声 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

将图 4 ( a)进行复制扩展 ,就得到了基准角度轴匹配曲线 ,如图 4 ( d)所示. 在给定的阈值下 ,距离轴和角度轴投影与基准投影均相似 ,则判定是目标 ;否则不是. 相似度比较算法采用常用的平均绝对差算法 ,公式定义为 Dl = 1 m · ∑ l+m +1 i = l | Np ( i) - Nq |. (9) 式中 :如果是距离轴投影比较 , m =m in (W p , W q ) , l = 1, 2, …, |W p , W q | + 1 ;如果是角度轴投影比较 , m = W p , l = 1, 2, …, W p . Np ( i) 、Nq ( i)分别表示 LP图和基准 LP图的轴向投影量 ,设定相似度阈值为 σT ,如果距离轴和角度轴投影均有 m in (Dl ) ΦσT ,则停止计算 ,并认定是目标. 2 算法复杂度与分析要得出识别结果 ,需 4个步骤 : 1)得到观察图像 LP图 ; 2)分割出观察图像 LP图中的目标轮廓区域; 3)计算目标轮廓区域在距离轴和角度轴上的投影统计量; 4)与基准 LP图作比较. 分别对每步所需计算量进行分析 , 1)查找表方法中取内存地址内容运算相当于加法运算 , 需要 (1 -ω) ·R ·P次加法运算; 2)计算轴向投影量相当于加法运算 ,最多需要 ( 1 -ω) ·R ·P次加法运算; 3)距离轴投影在第 2步中已经计算 ,这一步需要W p ·P次加法运算; 4)由式 ( 9)取极限情况 ,对距离轴投影 ,需要 2·( |W p - W q | + 1) ·m in (W p , W q ) 次加法运算和 ( |W p - W q | )次乘法运算 ,对角度轴 , 需要 (2·P) ·P次加法运算和 P次乘法运算;将加法和乘法都作为基本运算 , 则本文算法共需要 [2 (1 -ω) R + 2P +W p + 1 ]·P + ( |W p +W q | + 1) · [2m in (W p , W q ) + 1 ]次基本运算. 3 试验结果与分析常用 LPT算法是自然幂和三角函数运算组成的复杂运算 ,将自然幂函数、正弦函数和余弦函数展开成泰勒级数 ,分别记为 NE、NS、NC ,根据泰勒展开式 ,一次 NE 运算相当于 k + ∑ k n =2 (2n + 1) 次基本运算 ,一次 NS运算相当于 k + ∑ k n =2 (2 (2n - 1) + 1) 次基本运算 ,一次 NC 运算相当于 k + ∑ k n =2 [ 2 (2n) + 1 ] 次基本运算 ,其中 k为计算机中泰勒级数计算到足够精确时 n的取值 , 则常用 LPT算法共需要 4k + ∑ k n =2 (12n + 2) 次基本运算. 观察图像大小为 256 × 256, LP图像 90 ×90,取 W p =W q = 30,ω = 0. 5, R = P = 90, k取值为 15. 表 1为算法的计算效率对比情况. 在以上试验条件下 ,本文 LPT算法相对于常用 LPT算法速度提高了大约 3 000倍 ,匹配算法相对于常用相关匹配算法速度提高了 30倍左右. 表 1 算法的计算效率对比 Table 1 The com par ison of ca lcula tiona l effic iency 算法基本运算次数常用 LPT算法 12 279 600 本文 LPT算法 4 050 相关匹配识别算法 486 090 本文匹配算法 16 351 对于有不同噪声背景的观察图像 ,生成 LP图像时会将噪声带入 ,如图 5 ( a) ～( b) ,采用填充和去除孤立点的方法可消除噪声的影响 ,如图 5 ( c)所示. 用图 2 ( b) ～( d)、去除噪声后的图 5 ( c)与基准 LP图作相似度计算 ,结果如表 2所示. 其中 , W q = 32. W p 为观察 LP图目标轮廓区域宽度 ,距离轴和角度轴的 m in (Dl )为式 ( 9)计算出来的各自平均绝对差的最小值. 表 2 相似度分析 Table 2 The ana lysis of sim ilar ity 图序 W p 距离轴 Dl 角度轴 Dl 图 2 ( b) 31 1. 903 2 0. 822 2 图 2 ( c) 33 3. 750 0 2. 355 6 图 2 ( d) 32 2. 218 8 1. 344 4 图 5 ( c) 31 3. 300 0 2. 677 8 本文共采用 3组不同图像进行了实验. 第 1组是 40张目标作各种尺度和旋转变化的图像 ,使用最近邻插值方法;第 2组是 90张加入了各种不同噪声 ·374· 智能系统学报第 3卷

第4期严江江，等：一种基于对数极坐标变换的快速目标别算法 ·375 的目标变化图，加入的噪声包括高斯噪声、椒盐噪声 “组中正确识别的图像数除以每组总图像数即为识和加性噪声：第3组是50张非基准目标图像，其中别正确率」 3张有代表性图像如图6所示：实验结果见表3，每 (a)带噪声观察图像 (b)带噪声LP图像 (c)去除噪声后的LP图像图5有噪声的观察图像及其带噪声LP图像和去除噪声后的LP图像 Fig 5 The input mage,the logpolar mage with noise and the bgpolar mage with non-noise (a)图像1 (b)图像2 (c)图像3 图6非基准目标图 Fig 6 mages of non-object 表3目标识别正确率一种快速的改进算法，使其在计算效率上相对于常 Table 3 Results of the recogn ition correct rate 用算法有了较大的提高.同时本文利用对数极坐标正确识别率/% 平面目标的尺度和旋转不变性，提出了一种双轴投组别 0,=20,=30,=40,=5 影相似度分析算法对分割出来的目标轮廓区域进行第1组 325 75 95 975 相似度分析，增加了其可靠性.将二维图像的匹配运第2组288 755 944 977 算转换成2个轴向的一维投影匹配运算，减少了图第3组100100 100 100 像匹配的运算量，对目标识别尤其是快速目标识别从表3可以看到，噪声对识别正确率几乎没有提供了一个有效的途径影响.因为本文方法是针对目标轮廓的，在噪声不破参考文献：坏目标轮廓提取的情况下是不影响识别正确率的， [1 ]SCHWARTZ E L Spatial mapp ing in the prmate sensory 阈值·，的选取很重要，在试验中取4或5就可以达 projection:analytic structure and relevance b perception 到较高的识别正确率.对于非基准目标图，大多数不 [J].Bological Cybemetics,1977,25:181-194 满足式(8)，少量满足式(8)的相似度又不满足阈值 2]SCHWARTZ EL,GREVE D N,BONMASSAR G Space- 条件，所以取得了很高的识别正确率 variant active vision:definition,overview and example[J] 4结束语 Neural Networks,1995,8(7):1297-1308 [3]B ISHAY M,PETERS R A L KAMWAMURA K Object 针对常用的对数极坐标变换算法，本文提出了 detection in indoor scenes using bg polar mapping[C]// 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

的目标变化图 ,加入的噪声包括高斯噪声、椒盐噪声和加性噪声;第 3组是 50张非基准目标图像 ,其中 3张有代表性图像如图 6所示;实验结果见表 3,每一组中正确识别的图像数除以每组总图像数即为识别正确率. 图 5 有噪声的观察图像及其带噪声 LP图像和去除噪声后的 LP图像 Fig. 5 The input image, the log2polar image with noise and the log2polar image with non2noise 图 6 非基准目标图 Fig. 6 Images of non2object 表 3 目标识别正确率 Table 3 Results of the recogn ition correct ra te 组别正确识别率 / % σT = 2 σT = 3 σT = 4 σT = 5 第 1组 32. 5 75 95 97. 5 第 2组 28. 8 75. 5 94. 4 97. 7 第 3组 100 100 100 100 从表 3可以看到 ,噪声对识别正确率几乎没有影响. 因为本文方法是针对目标轮廓的 ,在噪声不破坏目标轮廓提取的情况下是不影响识别正确率的. 阈值σT 的选取很重要 ,在试验中取 4或 5就可以达到较高的识别正确率. 对于非基准目标图 ,大多数不满足式 (8) ,少量满足式 (8)的相似度又不满足阈值条件 ,所以取得了很高的识别正确率. 4 结束语针对常用的对数极坐标变换算法 ,本文提出了一种快速的改进算法 ,使其在计算效率上相对于常用算法有了较大的提高. 同时本文利用对数极坐标平面目标的尺度和旋转不变性 ,提出了一种双轴投影相似度分析算法对分割出来的目标轮廓区域进行相似度分析 ,增加了其可靠性. 将二维图像的匹配运算转换成 2个轴向的一维投影匹配运算 ,减少了图像匹配的运算量 ,对目标识别尤其是快速目标识别提供了一个有效的途径. 参考文献 : [ 1 ] SCHWARTZ E L. Spatial mapp ing in the p rimate sensory p rojection: analytic structure and relevance to percep tion [J ]. Biological Cybernetics, 1977, 25: 1812194. [ 2 ] SCHWARTZ E L, GREVE D N, BONMASSAR G. Space2 variant active vision: definition, overview and examp le[J ]. Neural Networks, 1995, 8 (7) : 129721308. [ 3 ]B ISHAY M, PETERS R A I, KAMWAMURA K. Object detection in indoor scenes using log2polar mapp ing [ C ] / / 第 4期严江江 ,等 :一种基于对数极坐标变换的快速目标别算法 ·375·

·376· 智能系统学报第3卷 Proceedings of IEEE Intemational Conference on Robotics 成像制导中的应用[J]字航学报，2005,26(3)：330- and Automation San Dieg,CA,USA,1994:775-780 333 [4]SLVA C,SANTOS-V CTOR J.Egomotion estmaton using WANG Li,L I Yanjun,ZHANG Ke The app lication of tar bgpolar mages [C]//Sixth Intemational Conference on get recognition algrithm based on bgpolar transomation Computer V ision Bombay,India,1998:967-972 for maging guidance[J].Joumal ofAstonautics,2005,26 [5 ESCOBAR M J,RU IZDEL-SOLAR J.Biobgically based (3):330-333 face recognition using Gabor filters and bgpolar mages 作者简介： [C]//Intemational Joint Conference on Neural Neworks 严江江，男，1979年生，博士研究 (CNN2002).Honolulu,U4,2002:1143-1147 生，主要研究方向为飞行器任务规划、 [6]HOTTA K,KUR ITA T,M ISH MA T Scale invariant face 智能搜索、计算机视觉等.发表学术论 detection method using higherorder local autocorrelation 文6篇 features extracted from bgpolar mage [C]//Proceedings of the 3rd IEEE Intemational Conference on Face Ges- 丁明跃，男，1961年生，特聘教授、博 ture Recognition Nara,Japan,1998:70-75. 士生导师，EEE高级会员，SPE会员，湖 [7吗月霞，刘波.用MS320C50实现图像目标的形心捕北省青年科协副会长，湖北省宇航学会获[J]光子学报，2001(4)：455-459 副理事长，主要研究方向为图像处理与 FENG Yuexia,LU ba The poid capturing of mage object 分析、计算机视觉及应用、医学图像处理 is realized using TMS320C50 [J].Acta Photnica Sinica, 和任务规划等.发表学术论文200余篇， 2001(4):455-459 其中被SCLEL,ISTP收录130余篇， [8 TANG Minshou The application of correlation matching 周成平，男，1957年生，副教授，主 technique in mage guidance[C]//Proceeding of CSAA 1st 要研究方向为图像处理、计算机视觉、 Electronic Conference of the Youth Los Angeles,USA, 任务规划等.先后获航天部、教育部科 1994 技进步三等奖各一项，发明专利一项： [9王立，李言俊，张科.对数极坐标变换识别算法在发表学术论文30余篇。 2008 Iterna tional Conference on Itelligent Com putation Technology and Automation 2008年智能计算技术与自动化国际会议 2008 Intemational Conference on Intelligent Computation Technology and Automation (IC CTA 2008)will be held on 20~22 October,2008 in Changsha,China C TA08 ams to provide a high-level intemational form for scientists,engineers,and educaors to present the state of the art of intelligent computation and automation research and applications in diverse fields The conference will feature plenary speeches given by renowned scholars and reg- ular sessions with broad coverage The conference proceedingswill be published by IEEE Computer Society All papers accepted will be included in IEEE Xp bre and arranged for indexing by both EI Compendex and ISTP. Ema il:icicta@126 com W ebsite:http://www.icicta org/index asp 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

Proceedings of IEEE International Conference on Robotics and Automation. San D iego, CA, USA, 1994: 7752780. [ 4 ] SILVA C, SANTOS2V ICTOR J. Egomotion estimation using log2polar images [ C ] / / Sixth International Conference on Computer V ision. Bombay, India, 1998: 9672972. [ 5 ] ESCOBAR M J, RU IZ2DEL2SOLAR J. Biologically based face recognition using Gabor filters and log2polar images [ C ] / / International Joint Conference on Neural Networks ( IJCNN2002). Honolulu, USA, 2002: 1143 21147. [ 6 ] HOTTA K, KUR ITA T, M ISH IMA T. Scale invariant face detection method using higher2order local autocorrelation features extracted from log2polar image [ C ] / / Proceedings of the 3 rd IEEE International Conference on Face & Ges2 ture Recognition. Nara, Japan, 1998: 70275. [ 7 ]冯月霞 , 刘波. 用 TMS320C50实现图像目标的形心捕获 [J ]. 光子学报 , 2001 (4) : 4552459. FENG Yuexia, L IU bo. The poid cap turing of image object is realized using TMS320C50 [J ]. Acta Photonica Sinica, 2001 (4) : 4552459. [ 8 ] TANG M inshou. The app lication of correlation matching technique in image guidance[C ] / / Proceeding of CSAA 1st Electronic Conference of the Youth. Los Angeles, USA, 1994. [ 9 ]王立 , 李言俊 , 张科. 对数极坐标变换识别算法在成像制导中的应用 [J ]. 宇航学报 , 2005, 26 ( 3) : 3302 333. WANG L i, L I Yanjun, ZHANG Ke. The app lication of tar2 get recognition algorithm based on log2polar transformation for imaging guidance[J ]. Journal ofA stronautics, 2005, 26 (3) : 3302333. 作者简介 : 严江江 ,男 , 1979 年生 ,博士研究生 ,主要研究方向为飞行器任务规划、智能搜索、计算机视觉等. 发表学术论文 6篇. 丁明跃 ,男 , 1961年生 ,特聘教授、博士生导师 , IEEE高级会员 , SP IE会员 ,湖北省青年科协副会长 ,湖北省宇航学会副理事长 ,主要研究方向为图像处理与分析、计算机视觉及应用、医学图像处理和任务规划等.发表学术论文 200余篇 , 其中被 SCI, EI, ISTP收录 130余篇. 周成平 ,男 , 1957年生 ,副教授 ,主要研究方向为图像处理、计算机视觉、任务规划等. 先后获航天部、教育部科技进步三等奖各一项 ,发明专利一项 ; 发表学术论文 30余篇. 2008 Interna tiona l Conference on Intelligent Computa tion Technology and Automa tion 2008年智能计算技术与自动化国际会议 2008 International Conference on Intelligent Computation Technology and Automation ( ICICTA 2008) will be held on 20～22 October, 2008 in Changsha, China. IC ICTA08 aim s to p rovide a high2level international forum for scientists, engineers, and educators to p resent the state of the art of intelligent computation and automation research and app lications in diverse fields. The conference will feature p lenary speeches given by renowned scholars and reg2 ular sessions with broad coverage. The conference p roceedingswill be published by IEEE Computer Society. A ll papers accep ted will be included in IEEE Xp lore and arranged for indexing by both EI Compendex and ISTP. E2ma il: icicta@126. com W ebsite: http: / /www. icicta. org/index. asp ·376· 智能系统学报第 3卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录