正在加载图片...
·81· 骆彦龙,等:基于改进残差学习的东巴象形文字识别 第1期 1.2东巴象形文字图像预处理 是双线性插值法,但是当原图像与尺寸归一化图 人工仿写的东巴象形文字受光照以及拍照设 像尺寸相差过大时,尺寸归一化后的图像纹理特 备等的影响,往往会产生极大的噪声,影响东巴 征易损坏,不利于深度学习模型识别。而像素区 象形文字数据集的质量,因此必须对其进行一系 域关系重采样法能够保留完整图像信息的条件 列的图像预处理。图2给出了本文建立东巴象形 下,将输入图像尺寸最大程度减小,大幅度减少 文字数据集的技术路线,具体步骤如下。 图像像素数以及数据量,在保证深度学习模型识 别准确率不变的前提下,加快模型的训练速度。 根据其他数据集图像尺寸大小设置的经验以及多 次对比实验验证,我们发现当图像尺寸归一化为 64×64时,可以取得最好的识别效果,并且模型训 手写文字 字符裁剪 灰度化 练速度快。本文对像素区域关系重采样法和双线 性插值法在东巴文字图像上的效果进行了简单的 实验对比,分别将图像尺寸归一化为64×64。 东巴象形文 字数据集 图3给出了实验结果。 数据标注 尺寸归一化 二值化 图2东巴象形文字数据集建立技术路线 Fig.2 Technical route for Dongba pictographs dataset es- (a)双线性插值法 (b)像素区域关系重采样法 tablishment 图3两种尺寸归一化方法示例 1)字符裁剪。对人工仿写的原始图像进行字 Fig.3 Samples of two size normalization methods 符裁剪,使得每张图像中仅包含一个东巴象形文 从图3中可以看出,双线性插值法后的东巴 字。具体过程如算法1所示。 象形文字纹理特征有残缺,而像素区域关系重采 算法1符裁剪算法 样可获得更好的尺寸归一化效果。 输入未裁剪的手写东巴象形文字图像X: 因此本文选择像素区域关系重采样法进行尺 输出仅包含一个东巴象形文字的图像Y。 寸归一化操作,其公式如式(3)所示: ①Xa←图像X的高度; A=B ②x←图像X的宽度; ∑a ③Yh←1/3X.-2/3Xk; (3) ④Y.←1/3X.-2/3Xm; f= ⑤Y←-Yh-Ywo 2)灰度化。黑白两种颜色反差较大,可提高 式中:B表示图像某区域内像素值矩阵;α是与 东巴象形文字识别的效果。为此,使用加权平均 B相对应的像素值系数矩阵,其取值取决于原图 值法进行图像灰度化,去除图像的颜色信息,将 像与尺寸归一化图像的尺寸大小关系;⊙表示 三通道的彩色图像转换成单通道的灰度图像。灰 Hadamard积;表示图像B区域通过尺寸归一化 度化公式如式(1)所示: 后的像素值。 Gray=0.299R+0.587G+0.114B (1) 5)数据标注。通过数据编码标注,将第i个 式中:R、G、B分别代表图像在(i,)处的红、 东巴象形文字的所有图像【统一编码为i,使计算 绿、蓝3种颜色分量像素值;Gray,代表图像在 机将图像和编码相互对应,如式(4)所示: (,)处的灰度值。 F()=i (4) 3)二值化。为了极大程度减少图像数据量, 式中F(·)表示编码标注算法,具体过程如算法 通过全局阈值二值化减少图像无关像素信息,并 2所示。 使整个图像呈现出明显的黑白效果,凸显东巴象 算法2编码标注算法 形文字轮廓,图像二值化公式如式(2)所示: 输入train,test(其中有命名为i(包含图像 sw-si )的文件夹) (2) 输出图像I与其编码i相互对应的xt文档 式中b表示图像二值化后图像在位,处的像素值。 ①for ietrain,test; 4)尺寸归一化。常用的图像尺寸归一化方法 ②for lei:1.2 东巴象形文字图像预处理 人工仿写的东巴象形文字受光照以及拍照设 备等的影响,往往会产生极大的噪声,影响东巴 象形文字数据集的质量,因此必须对其进行一系 列的图像预处理。图 2 给出了本文建立东巴象形 文字数据集的技术路线,具体步骤如下。 手写文字 字符裁剪 灰度化 数据标注 东巴象形文 字数据集 尺寸归一化 二值化 图 2 东巴象形文字数据集建立技术路线 Fig. 2 Technical route for Dongba pictographs dataset es￾tablishment 1) 字符裁剪。对人工仿写的原始图像进行字 符裁剪,使得每张图像中仅包含一个东巴象形文 字。具体过程如算法 1 所示。 算法 1 符裁剪算法 输入 未裁剪的手写东巴象形文字图像 X; 输出 仅包含一个东巴象形文字的图像 Y。 ① Xh ←图像 X 的高度; ② Xw ←图像 X 的宽度; ③ Yh ← 1/ 3Xh −2/ 3Xh; ④ Yw ← 1/ 3Xw −2/ 3Xw; ⑤ Y ← Yh −Yw。 2) 灰度化。黑白两种颜色反差较大,可提高 东巴象形文字识别的效果。为此,使用加权平均 值法进行图像灰度化,去除图像的颜色信息,将 三通道的彩色图像转换成单通道的灰度图像。灰 度化公式如式 (1) 所示: Grayi, j = 0.299Ri, j +0.587Gi, j +0.114Bi, j (1) Ri, j Gi, j Bi, j (i, j) Grayi, j (i, j) 式中: 、 、 分别代表图像在 处的红、 绿 、蓝 3 种颜色分量像素值; 代表图像在 处的灰度值。 3) 二值化。为了极大程度减少图像数据量, 通过全局阈值二值化减少图像无关像素信息,并 使整个图像呈现出明显的黑白效果,凸显东巴象 形文字轮廓,图像二值化公式如式 (2) 所示: bi, j = { 0, Grayi, j ⩾ 125 255, Grayi, j < 125 (2) 式中 bi, j 表示图像二值化后图像在 (i, j) 处的像素值。 4) 尺寸归一化。常用的图像尺寸归一化方法 64×64 64×64 是双线性插值法,但是当原图像与尺寸归一化图 像尺寸相差过大时,尺寸归一化后的图像纹理特 征易损坏,不利于深度学习模型识别。而像素区 域关系重采样法能够保留完整图像信息的条件 下,将输入图像尺寸最大程度减小,大幅度减少 图像像素数以及数据量,在保证深度学习模型识 别准确率不变的前提下,加快模型的训练速度。 根据其他数据集图像尺寸大小设置的经验以及多 次对比实验验证,我们发现当图像尺寸归一化为 时,可以取得最好的识别效果,并且模型训 练速度快。本文对像素区域关系重采样法和双线 性插值法在东巴文字图像上的效果进行了简单的 实验对比,分别将图像尺寸归一化为 。 图 3 给出了实验结果。 (a) 双线性插值法 (b) 像素区域关系重采样法 图 3 两种尺寸归一化方法示例 Fig. 3 Samples of two size normalization methods 从图 3 中可以看出,双线性插值法后的东巴 象形文字纹理特征有残缺,而像素区域关系重采 样可获得更好的尺寸归一化效果。 因此本文选择像素区域关系重采样法进行尺 寸归一化操作,其公式如式 (3) 所示: A = B⊙α fi, j = ∑ i, j ai, j ∑ i, j αi, j (3) α ⊙ fi, j 式中:B 表示图像某区域内像素值矩阵; 是与 B 相对应的像素值系数矩阵,其取值取决于原图 像与尺寸归一化图像的尺寸大小关系; 表示 Hadamard 积; 表示图像 B 区域通过尺寸归一化 后的像素值。 5) 数据标注。通过数据编码标注,将第 i 个 东巴象形文字的所有图像 I 统一编码为 i,使计算 机将图像和编码相互对应,如式 (4) 所示: F(I) = i (4) 式中 F(·) 表示编码标注算法,具体过程如算法 2 所示。 算法 2 编码标注算法 输入 train,test (其中有命名为 i(包含图像 I) 的文件夹) 输出 图像 I 与其编码 i 相互对应的 txt 文档 ① for i ∈ train,test; ②for I ∈ i ; ·81· 骆彦龙,等:基于改进残差学习的东巴象形文字识别 第 1 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有