对二维水印图像进行置乱变换．本文采用了 Arnold 变换［9］对二维水印

正在加载图片...

第4期王敬等：一种基于MPEG2AAC编码的音频水印方法 .527 对二维水印图像进行置乱变换.本文采用了Arnold 0≤j<N,k=iN+j (3) 变换[对二维水印图像W(大小为N×N)进行置 2.2 基于escape coding的水印嵌入算法乱变换.数字化后的图像可以看作一个矩阵，令矩通过修改escape--word的最低有效位(LSB)来阵的坐标x,y∈{0,1,2,3，，N-1,于是Arnold 嵌入水印，MPEG一2AAC中规定，量化后的系数最变换可以表示为：大值不能超过8191，因此escape-word的最低有效 mod 位数可以从4bit到12bit.为了减小嵌入水印产生 N) (2) 的听觉失真，只使用1bit和2bit的最低有效位来嵌由此作迭代程序，直到图像变得杂乱无章，接入水印.当escape--prefix中“1"的个数为零即量化下来，对置乱后的二维水印图像进行降维处理（即将系数在16到31时，只取1bit最低有效位进行嵌置乱后的二维水印图像转换为一维的数字水印序列入；当escape-prefix中“l”的个数大于零即量化系 V,以便将二维的灰度图像嵌入到一维的数字音频数大于或等于32时，取2bit最低有效位进行嵌入信号中)，即：具体的嵌入方法是根据当前的水印象素值来对 V=1v(k)=w(i,j),iN, escape-word的最低有效位进行修改（如表2）· 表2嵌入方法 Table 2 Embedding method 条件最低有效位(LSB)bt 水印象素值嵌入水印 255 1' escape--prfi中-"的个数=0 1 0 0' 255.255 11' 255,0 ‘10 escape--prefix中l的个数>0 2 0,255 01' 0.0 *00 为了分析嵌入水印的结果，需要对水印嵌入后 PEAQ模型是一种音频质量客观评价模型.它将参的音频的听觉质量进行评价，国内经常使用的信噪考信号和失真信号通过感知声学模型模拟人对音频比(signal-to-noise ratio,SNR)方法没有考虑到人类信号的感知，认知模型将感知声学模型输出值在频听觉系统的感知特性，对于高质量的音频编解码系域和时域进行综合产生一系列模型输出变量统而言这种方法并不实用.因此本文采用ITUR (MOV),通过一个人工神经网络，计算出最终的客提出的感知音频质量评价PEAQ(perceived evalua~ 观失真等级ODG(objective difference grade),ODG tion of audio quality)模型1o来评价音频听觉质量. 有五个等级，见表3.实验结果如表4所示表3ODG的五个等级 Table 3 Five classes of ODG 客观失真等级(ODG) 0 -1 -2 -3 -4 感知效果不可感知可感知有些恼人恼人非常恼人表4水印嵌入结果 Table 4 Results of watermark embedding 音乐名称文件长度/ 嵌入水印/ 每秒嵌入水印/ 感知音频质量评价：客观失真等级 (48000h,133kbps) 5 bit (hits) PEAQ:ODG 流行音乐 19.63 18075 920.8 -0.312 爵士乐 20.73 30437 1468.3 -0.390 经典音乐 19.71 42879 2175.5 -0.773 民歌 20.28 18447 909.6 -0.744 鼓乐 20.40 23833 1168.2 -0.146 摇滚乐 20.06 11261 561.7 -0.247 演唱 20.10 7968 396.4 -0.245 乡村音乐 20.20 30139 1492.0 -0.757对二维水印图像进行置乱变换．本文采用了 Arnold 变换［9］对二维水印图像 W （大小为 N× N）进行置乱变换．数字化后的图像可以看作一个矩阵令矩阵的坐标 xy∈｛0123…N－1｝于是 Arnold 变换可以表示为： x′ y′ ＝ 1 2 1 1 x y （mod N）（2）由此作迭代程序直到图像变得杂乱无章．接下来对置乱后的二维水印图像进行降维处理（即将置乱后的二维水印图像转换为一维的数字水印序列 V 以便将二维的灰度图像嵌入到一维的数字音频信号中）即： V ＝｛v （ k）＝ w（ ij）0≤ i＜ N 0≤ j＜ Nk＝ i·N＋ j｝（3） 2∙2 基于 escape coding 的水印嵌入算法通过修改 escape－word 的最低有效位（LSB）来嵌入水印．MPEG－2AAC 中规定量化后的系数最大值不能超过8191因此 escape－word 的最低有效位数可以从4bit 到12bit．为了减小嵌入水印产生的听觉失真只使用1bit 和2bit 的最低有效位来嵌入水印．当 escape－prefix 中“1”的个数为零即量化系数在16到31时只取1bit 最低有效位进行嵌入；当 escape－prefix 中“1”的个数大于零即量化系数大于或等于32时取2bit 最低有效位进行嵌入．具体的嵌入方法是根据当前的水印象素值来对 escape－word的最低有效位进行修改（如表2）．表2 嵌入方法 Table2 Embedding method 条件最低有效位（LSB）／bit 水印象素值嵌入水印 escape－prefix 中“1”的个数＝0 1 255 ‘1’ 0 ‘0’ 255255 ‘11’ escape－prefix 中“1”的个数＞0 2 2550 ‘10’ 0255 ‘01’ 00 ‘00’ 为了分析嵌入水印的结果需要对水印嵌入后的音频的听觉质量进行评价．国内经常使用的信噪比（signa-l to-noise ratioSNR）方法没有考虑到人类听觉系统的感知特性对于高质量的音频编解码系统而言这种方法并不实用．因此本文采用 ITU-R 提出的感知音频质量评价 PEAQ （perceived evaluation of audio quality）模型［10］来评价音频听觉质量． PEAQ 模型是一种音频质量客观评价模型．它将参考信号和失真信号通过感知声学模型模拟人对音频信号的感知认知模型将感知声学模型输出值在频域和时域进行综合产生一系列模型输出变量（MOV）通过一个人工神经网络计算出最终的客观失真等级 ODG （objective difference grade）．ODG 有五个等级见表3．实验结果如表4所示．表3 ODG 的五个等级 Table3 Five classes of ODG 客观失真等级（ODG） 0 －1 －2 －3 －4 感知效果不可感知可感知有些恼人恼人非常恼人表4 水印嵌入结果 Table4 Results of watermark embedding 音乐名称（48000Hz133kbps）文件长度／ s 嵌入水印／ bit 每秒嵌入水印／（bit·s －1）感知音频质量评价∶客观失真等级 PEAQ∶ODG 流行音乐 19∙63 18075 920∙8 －0∙312 爵士乐 20∙73 30437 1468∙3 －0∙390 经典音乐 19∙71 42879 2175∙5 －0∙773 民歌 20∙28 18447 909∙6 －0∙744 鼓乐 20∙40 23833 1168∙2 －0∙146 摇滚乐 20∙06 11261 561∙7 －0∙247 演唱 20∙10 7968 396∙4 －0∙245 乡村音乐 20∙20 30139 1492∙0 －0∙757 第4期王敬等：一种基于 MPEG－2AAC 编码的音频水印方法 ·527·

<<向上翻页向下翻页>>

点击下载：一种基于MPEG-2 AAC编码的音频水印方法