2∙3 嵌入算法改进不难发现虽然 escape coding 在各类音

正在加载图片...

.528 北京科技大学学报第31卷 2.3嵌入算法改进 escape coding的发生频率与该音乐在频率上的分布不难发现，虽然escape coding在各类音乐压缩密切相关，如图1所示，经典音乐的水印嵌入量大，时都会发生，但发生的频率却各不相同，嵌入水印的它的频率分布主要集中在低频区；演唱的水印嵌入码率会随着宿主不同有较大不同，同时对宿主音频量较小，它的频率分布则比较均匀，也就是说，能量音质的改变也不相同主要集中在低频区时的音乐发生escape coding的频通过比较这些音乐的频谱分布可以发现，率要比能量在各个频率分布均匀的音乐高得多 (a) (b) 图1不同嵌入码率的频率分布。(a)经典音乐的频率分布；(b)演唱的频率分布 Fig.I Frequency distributions at different embedded rates:(a)classic frequency distribution:(b)singing frequeney distribution 由于人耳对于低频声音敏感，为了进一步提高表5长窗信号水印嵌入量控制嵌入水印后的听觉质量，应该减少水印在低频段的 Table 5 Watermark embedding control by long window signal 嵌入量，在MPEG一2AAC中，MDCT系数根据心比例因子带号，动 sb5 5<b<20 20<b 理声学模型一Ⅱ从低频到高频被划分成了多个比例嵌入量/bit 10 无限制因子频带，因此可由escape coding发生所处的比例因子带号来判断当前的频率段，从而控制各频段上经过码率控制后的水印嵌入结果如表6所示，的水印嵌入量，但通过实验发现，由于大部分的所有嵌入水印的音乐在听觉质量上都有了提高，同 escape coding发生在低频区域，如果一味的控制低时不同音频水印嵌入码率的差异减小，说明嵌入码频区的水印嵌入，提高了听觉质量，却使水印的嵌入率更稳定码率变得很小. 为了平衡水印的嵌入码率和不可感知性，本文 3水印提取利用AAC中根据心理声学模型计算出的感知熵PE 水印提取即水印嵌入的逆过程，在Huffman解 (perceptual entropy)作为另一嵌入条件.PE表码之前，找到所有使用码书号为l1的Huffman码示信号对噪声的容忍度.在AAC中，当PE值大于字，并判断该编码是否使用了escape coding根据嵌 1800时表明该段音乐变化较大，为避免失真AAC 入算法可以得到嵌入的水印值，再将提取的水印通给它分配较多的比特数，使用短窗(256个样本)来过Anorld反变换9，恢复成原来的图像. 进行编码；当PE小于1800时，为提高编码效率使用长窗(2048个样本)给信号编码，根据刘伟等12] 4实验结果的研究结果表明，MP3压缩后的信噪比与PE值的以fok文件为例，水印图像（大小70×70）如变化趋势一致，即对PE较大的帧MP3所产生的影图2(a)所示，实际嵌入的水印量是6495bit 响较小，因此在短窗信号中嵌入水印引起的失真较 (图2(b),在音频文件没有受到攻击时，水印可以小，这一点同样适用于AAC. 100%被提取出来（图2(c)·由于嵌入和提取算法基于escape coding发生的频段和PE的大小，复杂度小，嵌入和提取的速度很快，几乎不会增加音本文对水印嵌入算法进行了改进：对PE小于1800 频文件压缩和解压缩的时间，虽然这种水印嵌入量的短窗信号不限制水印嵌入量，而对长窗信号则由较大，但由于只是对Huffman的LsB进行修改，原比例因子带号决定水印嵌入量（表5），压缩音频的比特率不会增加2∙3 嵌入算法改进不难发现虽然 escape coding 在各类音乐压缩时都会发生但发生的频率却各不相同嵌入水印的码率会随着宿主不同有较大不同同时对宿主音频音质的改变也不相同．通过比较这些音乐的频谱分布可以发现 escape coding 的发生频率与该音乐在频率上的分布密切相关如图1所示．经典音乐的水印嵌入量大它的频率分布主要集中在低频区；演唱的水印嵌入量较小它的频率分布则比较均匀．也就是说能量主要集中在低频区时的音乐发生 escape coding 的频率要比能量在各个频率分布均匀的音乐高得多．图1 不同嵌入码率的频率分布．（a）经典音乐的频率分布；（b）演唱的频率分布 Fig．1 Frequency distributions at different embedded rates：（a） classic frequency distribution；（b） singing frequency distribution 由于人耳对于低频声音敏感为了进一步提高嵌入水印后的听觉质量应该减少水印在低频段的嵌入量．在 MPEG－2AAC 中MDCT 系数根据心理声学模型－Ⅱ从低频到高频被划分成了多个比例因子频带因此可由 escape coding 发生所处的比例因子带号来判断当前的频率段从而控制各频段上的水印嵌入量．但通过实验发现由于大部分的 escape coding 发生在低频区域如果一味的控制低频区的水印嵌入提高了听觉质量却使水印的嵌入码率变得很小．为了平衡水印的嵌入码率和不可感知性本文利用 AAC 中根据心理声学模型计算出的感知熵 PE （perceptual entropy）［11］作为另一嵌入条件．PE 表示信号对噪声的容忍度．在 AAC 中当 PE 值大于 1800时表明该段音乐变化较大为避免失真 AAC 给它分配较多的比特数使用短窗（256个样本）来进行编码；当 PE 小于1800时为提高编码效率使用长窗（2048个样本）给信号编码．根据刘伟等［12］的研究结果表明MP3压缩后的信噪比与 PE 值的变化趋势一致即对 PE 较大的帧 MP3所产生的影响较小因此在短窗信号中嵌入水印引起的失真较小这一点同样适用于 AAC．基于 escape coding 发生的频段和 PE 的大小本文对水印嵌入算法进行了改进：对 PE 小于1800 的短窗信号不限制水印嵌入量而对长窗信号则由比例因子带号决定水印嵌入量（表5）．表5 长窗信号水印嵌入量控制 Table5 Watermark embedding control by long window signal 比例因子带号sb sb≤5 5＜sb＜20 20＜sb 嵌入量／bit 0 10 无限制经过码率控制后的水印嵌入结果如表6所示．所有嵌入水印的音乐在听觉质量上都有了提高同时不同音频水印嵌入码率的差异减小说明嵌入码率更稳定． 3 水印提取水印提取即水印嵌入的逆过程．在 Huffman 解码之前找到所有使用码书号为11的 Huffman 码字并判断该编码是否使用了 escape coding；根据嵌入算法可以得到嵌入的水印值再将提取的水印通过 Anorld 反变换［9］恢复成原来的图像． 4 实验结果以 folk 文件为例水印图像（大小70×70）如图2（a）所示实际嵌入的水印量是 6495 bit （图2（b））在音频文件没有受到攻击时水印可以 100％被提取出来（图2（c））．由于嵌入和提取算法复杂度小嵌入和提取的速度很快几乎不会增加音频文件压缩和解压缩的时间．虽然这种水印嵌入量较大但由于只是对 Huffman 的 LSB 进行修改原压缩音频的比特率不会增加． ·528· 北京科技大学学报第31卷

<<向上翻页向下翻页>>

点击下载：一种基于MPEG-2 AAC编码的音频水印方法