正在加载图片...
第4期 王敬等:一种基于MPEG2AAC编码的音频水印方法 .527 对二维水印图像进行置乱变换.本文采用了Arnold 0≤j<N,k=iN+j (3) 变换[对二维水印图像W(大小为N×N)进行置 2.2 基于escape coding的水印嵌入算法 乱变换.数字化后的图像可以看作一个矩阵,令矩 通过修改escape--word的最低有效位(LSB)来 阵的坐标x,y∈{0,1,2,3,,N-1,于是Arnold 嵌入水印,MPEG一2AAC中规定,量化后的系数最 变换可以表示为: 大值不能超过8191,因此escape-word的最低有效 mod 位数可以从4bit到12bit.为了减小嵌入水印产生 N) (2) 的听觉失真,只使用1bit和2bit的最低有效位来嵌 由此作迭代程序,直到图像变得杂乱无章,接 入水印.当escape--prefix中“1"的个数为零即量化 下来,对置乱后的二维水印图像进行降维处理(即将 系数在16到31时,只取1bit最低有效位进行嵌 置乱后的二维水印图像转换为一维的数字水印序列 入;当escape-prefix中“l”的个数大于零即量化系 V,以便将二维的灰度图像嵌入到一维的数字音频 数大于或等于32时,取2bit最低有效位进行嵌入 信号中),即: 具体的嵌入方法是根据当前的水印象素值来对 V=1v(k)=w(i,j),iN, escape-word的最低有效位进行修改(如表2)· 表2嵌入方法 Table 2 Embedding method 条件 最低有效位(LSB)bt 水印象素值 嵌入水印 255 1' escape--prfi中-"的个数=0 1 0 0' 255.255 11' 255,0 ‘10 escape--prefix中l的个数>0 2 0,255 01' 0.0 *00 为了分析嵌入水印的结果,需要对水印嵌入后 PEAQ模型是一种音频质量客观评价模型.它将参 的音频的听觉质量进行评价,国内经常使用的信噪 考信号和失真信号通过感知声学模型模拟人对音频 比(signal-to-noise ratio,SNR)方法没有考虑到人类 信号的感知,认知模型将感知声学模型输出值在频 听觉系统的感知特性,对于高质量的音频编解码系 域和时域进行综合产生一系列模型输出变量 统而言这种方法并不实用.因此本文采用ITUR (MOV),通过一个人工神经网络,计算出最终的客 提出的感知音频质量评价PEAQ(perceived evalua~ 观失真等级ODG(objective difference grade),ODG tion of audio quality)模型1o来评价音频听觉质量. 有五个等级,见表3.实验结果如表4所示 表3ODG的五个等级 Table 3 Five classes of ODG 客观失真等级(ODG) 0 -1 -2 -3 -4 感知效果 不可感知 可感知 有些恼人 恼人 非常恼人 表4水印嵌入结果 Table 4 Results of watermark embedding 音乐名称 文件长度/ 嵌入水印/ 每秒嵌入水印/ 感知音频质量评价:客观失真等级 (48000h,133kbps) 5 bit (hits) PEAQ:ODG 流行音乐 19.63 18075 920.8 -0.312 爵士乐 20.73 30437 1468.3 -0.390 经典音乐 19.71 42879 2175.5 -0.773 民歌 20.28 18447 909.6 -0.744 鼓乐 20.40 23833 1168.2 -0.146 摇滚乐 20.06 11261 561.7 -0.247 演唱 20.10 7968 396.4 -0.245 乡村音乐 20.20 30139 1492.0 -0.757对二维水印图像进行置乱变换.本文采用了 Arnold 变换[9]对二维水印图像 W (大小为 N× N)进行置 乱变换.数字化后的图像可以看作一个矩阵‚令矩 阵的坐标 x‚y∈{0‚1‚2‚3‚…‚N-1}‚于是 Arnold 变换可以表示为: x′ y′ = 1 2 1 1 x y (mod N) (2) 由此作迭代程序‚直到图像变得杂乱无章.接 下来‚对置乱后的二维水印图像进行降维处理(即将 置乱后的二维水印图像转换为一维的数字水印序列 V ‚以便将二维的灰度图像嵌入到一维的数字音频 信号中)‚即: V ={v ( k)= w( i‚j)‚0≤ i< N‚ 0≤ j< N‚k= i·N+ j} (3) 2∙2 基于 escape coding 的水印嵌入算法 通过修改 escape-word 的最低有效位(LSB)来 嵌入水印.MPEG-2AAC 中规定‚量化后的系数最 大值不能超过8191‚因此 escape-word 的最低有效 位数可以从4bit 到12bit.为了减小嵌入水印产生 的听觉失真‚只使用1bit 和2bit 的最低有效位来嵌 入水印.当 escape-prefix 中“1”的个数为零即量化 系数在16到31时‚只取1bit 最低有效位进行嵌 入;当 escape-prefix 中“1”的个数大于零即量化系 数大于或等于32时‚取2bit 最低有效位进行嵌入. 具体的嵌入方法是根据当前的水印象素值来对 escape-word的最低有效位进行修改(如表2). 表2 嵌入方法 Table2 Embedding method 条件 最低有效位(LSB)/bit 水印象素值 嵌入水印 escape-prefix 中“1”的个数=0 1 255 ‘1’ 0 ‘0’ 255‚255 ‘11’ escape-prefix 中“1”的个数>0 2 255‚0 ‘10’ 0‚255 ‘01’ 0‚0 ‘00’ 为了分析嵌入水印的结果‚需要对水印嵌入后 的音频的听觉质量进行评价.国内经常使用的信噪 比(signa-l to-noise ratio‚SNR)方法没有考虑到人类 听觉系统的感知特性‚对于高质量的音频编解码系 统而言这种方法并不实用.因此本文采用 ITU-R 提出的感知音频质量评价 PEAQ (perceived evalua￾tion of audio quality)模型[10]来评价音频听觉质量. PEAQ 模型是一种音频质量客观评价模型.它将参 考信号和失真信号通过感知声学模型模拟人对音频 信号的感知‚认知模型将感知声学模型输出值在频 域 和 时 域 进 行 综 合 产 生 一 系 列 模 型 输 出 变 量 (MOV)‚通过一个人工神经网络‚计算出最终的客 观失真等级 ODG (objective difference grade).ODG 有五个等级‚见表3.实验结果如表4所示. 表3 ODG 的五个等级 Table3 Five classes of ODG 客观失真等级(ODG) 0 -1 -2 -3 -4 感知效果 不可感知 可感知 有些恼人 恼人 非常恼人 表4 水印嵌入结果 Table4 Results of watermark embedding 音乐名称 (48000Hz‚133kbps) 文件长度/ s 嵌入水印/ bit 每秒嵌入水印/ (bit·s -1) 感知音频质量评价∶客观失真等级‚ PEAQ∶ODG 流行音乐 19∙63 18075 920∙8 -0∙312 爵士乐 20∙73 30437 1468∙3 -0∙390 经典音乐 19∙71 42879 2175∙5 -0∙773 民歌 20∙28 18447 909∙6 -0∙744 鼓乐 20∙40 23833 1168∙2 -0∙146 摇滚乐 20∙06 11261 561∙7 -0∙247 演唱 20∙10 7968 396∙4 -0∙245 乡村音乐 20∙20 30139 1492∙0 -0∙757 第4期 王 敬等: 一种基于 MPEG-2AAC 编码的音频水印方法 ·527·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有