正在加载图片...
·1530 工程科学学报.第42卷,第11期 52 BG-BDZT 图6火车号字符检测结果示例 Fig.6 Examples of wagon number character detection results 11位Luhn算法计算得来,校验位可以用来判断识 如图7是一个校验纠错的例子.图中每一行 别的火车号是否正确.第12位校验数字的生成方 对应一个位置的检测结果,包含依概率排列的 式如式(3)所示 8个可能的类别号及其相应概率,一共12行对应 搜索到的构成火车号的12个字符.如果取第一列 10- k×d)/10+(k×d)% 10 %10%10 概率最大的结果,则会发现校验错误.原因是第 (3) 10位字符错误地将数字“8”识别为数字“9”,可以 其中,k为加权系数,对奇数位为2,对偶数位为1, 看出排除第一列最大概率后,第10位字符为“8” d,表示第i位火车号数字,“”表示整除,“%”表示 的概率要比其他所有的概率都要大,因此将第 模运算.计算各位数字乘以权重后得到数字的个 10位的“9”替换为“8”(图中红框所示),此时校验 位和十位相加之和,并取距离下一个最近的10的 通过,得到正确的火车号 整数倍的差值作为校验结果 5检测模型优化 对上一步得到的字符与概率矩阵,首先选择 每一位最大概率的数字进行校验,如果校验通过, 在实际工程应用中,除识别准确率外,识别速 则输出这些数字作为火车号的识别结果;如果校 度也是一个影响使用效果的关键因素.深度神经 验错误,则需根据概率矩阵进行替换纠错.替换的 网络的计算量主要消耗在卷积层特征提取阶段, 策略是:将每个位置的最大概率排除后,在其他的 随着网络中各个卷积层中通道数的增加计算量急 概率值中寻找最大的概率值,用对应的类别替代 剧增加.通道数一般都是人工根据经验设定,但不 当前位置最大概率所对应的类别,然后再对新的 同应用所需要提取的特征数可能不同.因此,可以 数字串进行校验,如果通过则视为纠正正确,输出 通过一定的剪枝技术去除多余的通道,从而降低 新的火车号;否则,恢复交换前位置,再接着寻找 计算量,提高检测速度. 下一个最大的概率值,如此迭代进行直到校验正 本文采用“静态剪枝+精细调节”的方式进行 确,或尝试的次数超过10次为止 网络剪枝,参考基于批归一化(Batch norm)因子剪 30.86426940.00109050.00108910.00061870.00027320.00022560.00020580.000131 10.77645870.00029790.00019930.00016740.00015300.00013980.00008060.000074 50.76884630.00057370.00053080.00023110.00010640.00009060.00005590.000053 20.78120770.00106300.00048140.00031260.00024990.00020230.00018050.000144 90.90431780.00154500.00021440.00019350.00014520.00012760.00008370.000083 30.89192050.00353640.00231810.00157320.00147980.00090890.00057970.000572 40.94929530.00153360.00067550.00044080.00036310.00034290.00024170.000209 10.62864920.00299240.00267480.00146360.00102550.00064190.00037670.000277 00.92036660.00703630.00213790.00092080.00090920.00045140.00033310.000321 90.87122780.01868650.00381810.00337740.00300720.00295170.00243300.001308 00.94245660.00077210.00064170.00038250.00031680.00026220.00021530.000189 10.55738090.00016730.00016470.00015150.00012920.00008760.00008040.000064 图7每个字符对应的前8个最大概率类别、概率值及校验纠错位 Fig.7 Top 8 class and corresponding probabilities of every character and correction by verification11 位 Luhn 算法计算得来,校验位可以用来判断识 别的火车号是否正确. 第 12 位校验数字的生成方 式如式(3)所示. d12 =   10−   ∑ 11 i=1 (ki ×di)/10+(ki ×di)%10   %10   %10 (3) 其中,ki 为加权系数,对奇数位为 2,对偶数位为 1, di 表示第 i 位火车号数字,“/”表示整除,“%”表示 模运算. 计算各位数字乘以权重后得到数字的个 位和十位相加之和,并取距离下一个最近的 10 的 整数倍的差值作为校验结果. 对上一步得到的字符与概率矩阵,首先选择 每一位最大概率的数字进行校验,如果校验通过, 则输出这些数字作为火车号的识别结果;如果校 验错误,则需根据概率矩阵进行替换纠错. 替换的 策略是:将每个位置的最大概率排除后,在其他的 概率值中寻找最大的概率值,用对应的类别替代 当前位置最大概率所对应的类别,然后再对新的 数字串进行校验,如果通过则视为纠正正确,输出 新的火车号;否则,恢复交换前位置,再接着寻找 下一个最大的概率值,如此迭代进行直到校验正 确,或尝试的次数超过 10 次为止. 如图 7 是一个校验纠错的例子. 图中每一行 对应一个位置的检测结果 ,包含依概率排列的 8 个可能的类别号及其相应概率,一共 12 行对应 搜索到的构成火车号的 12 个字符. 如果取第一列 概率最大的结果,则会发现校验错误. 原因是第 10 位字符错误地将数字“8”识别为数字“9”,可以 看出排除第一列最大概率后,第 10 位字符为“8” 的概率要比其他所有的概率都要大 ,因此将第 10 位的“9”替换为“8”(图中红框所示),此时校验 通过,得到正确的火车号. 5    检测模型优化 在实际工程应用中,除识别准确率外,识别速 度也是一个影响使用效果的关键因素. 深度神经 网络的计算量主要消耗在卷积层特征提取阶段, 随着网络中各个卷积层中通道数的增加计算量急 剧增加. 通道数一般都是人工根据经验设定,但不 同应用所需要提取的特征数可能不同. 因此,可以 通过一定的剪枝技术去除多余的通道,从而降低 计算量,提高检测速度. 本文采用“静态剪枝+精细调节”的方式进行 网络剪枝,参考基于批归一化(Batch norm)因子剪 图 6    火车号字符检测结果示例 Fig.6    Examples of wagon number character detection results 图 7    每个字符对应的前 8 个最大概率类别、概率值及校验纠错位 Fig.7    Top 8 class and corresponding probabilities of every character and correction by verification · 1530 · 工程科学学报,第 42 卷,第 11 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有