正在加载图片...
.528 北京科技大学学报 第31卷 2.3嵌入算法改进 escape coding的发生频率与该音乐在频率上的分布 不难发现,虽然escape coding在各类音乐压缩 密切相关,如图1所示,经典音乐的水印嵌入量大, 时都会发生,但发生的频率却各不相同,嵌入水印的 它的频率分布主要集中在低频区;演唱的水印嵌入 码率会随着宿主不同有较大不同,同时对宿主音频 量较小,它的频率分布则比较均匀,也就是说,能量 音质的改变也不相同 主要集中在低频区时的音乐发生escape coding的频 通过比较这些音乐的频谱分布可以发现, 率要比能量在各个频率分布均匀的音乐高得多 (a) (b) 图1不同嵌入码率的频率分布。(a)经典音乐的频率分布;(b)演唱的频率分布 Fig.I Frequency distributions at different embedded rates:(a)classic frequency distribution:(b)singing frequeney distribution 由于人耳对于低频声音敏感,为了进一步提高 表5长窗信号水印嵌入量控制 嵌入水印后的听觉质量,应该减少水印在低频段的 Table 5 Watermark embedding control by long window signal 嵌入量,在MPEG一2AAC中,MDCT系数根据心 比例因子带号,动 sb5 5<b<20 20<b 理声学模型一Ⅱ从低频到高频被划分成了多个比例 嵌入量/bit 10 无限制 因子频带,因此可由escape coding发生所处的比例 因子带号来判断当前的频率段,从而控制各频段上 经过码率控制后的水印嵌入结果如表6所示, 的水印嵌入量,但通过实验发现,由于大部分的 所有嵌入水印的音乐在听觉质量上都有了提高,同 escape coding发生在低频区域,如果一味的控制低 时不同音频水印嵌入码率的差异减小,说明嵌入码 频区的水印嵌入,提高了听觉质量,却使水印的嵌入 率更稳定 码率变得很小. 为了平衡水印的嵌入码率和不可感知性,本文 3水印提取 利用AAC中根据心理声学模型计算出的感知熵PE 水印提取即水印嵌入的逆过程,在Huffman解 (perceptual entropy)作为另一嵌入条件.PE表 码之前,找到所有使用码书号为l1的Huffman码 示信号对噪声的容忍度.在AAC中,当PE值大于 字,并判断该编码是否使用了escape coding根据嵌 1800时表明该段音乐变化较大,为避免失真AAC 入算法可以得到嵌入的水印值,再将提取的水印通 给它分配较多的比特数,使用短窗(256个样本)来 过Anorld反变换9,恢复成原来的图像. 进行编码;当PE小于1800时,为提高编码效率使 用长窗(2048个样本)给信号编码,根据刘伟等12] 4实验结果 的研究结果表明,MP3压缩后的信噪比与PE值的 以fok文件为例,水印图像(大小70×70)如 变化趋势一致,即对PE较大的帧MP3所产生的影 图2(a)所示,实际嵌入的水印量是6495bit 响较小,因此在短窗信号中嵌入水印引起的失真较 (图2(b),在音频文件没有受到攻击时,水印可以 小,这一点同样适用于AAC. 100%被提取出来(图2(c)·由于嵌入和提取算法 基于escape coding发生的频段和PE的大小, 复杂度小,嵌入和提取的速度很快,几乎不会增加音 本文对水印嵌入算法进行了改进:对PE小于1800 频文件压缩和解压缩的时间,虽然这种水印嵌入量 的短窗信号不限制水印嵌入量,而对长窗信号则由 较大,但由于只是对Huffman的LsB进行修改,原 比例因子带号决定水印嵌入量(表5), 压缩音频的比特率不会增加2∙3 嵌入算法改进 不难发现‚虽然 escape coding 在各类音乐压缩 时都会发生‚但发生的频率却各不相同‚嵌入水印的 码率会随着宿主不同有较大不同‚同时对宿主音频 音质的改变也不相同. 通过比 较 这 些 音 乐 的 频 谱 分 布 可 以 发 现‚ escape coding 的发生频率与该音乐在频率上的分布 密切相关‚如图1所示.经典音乐的水印嵌入量大‚ 它的频率分布主要集中在低频区;演唱的水印嵌入 量较小‚它的频率分布则比较均匀.也就是说‚能量 主要集中在低频区时的音乐发生 escape coding 的频 率要比能量在各个频率分布均匀的音乐高得多. 图1 不同嵌入码率的频率分布.(a) 经典音乐的频率分布;(b) 演唱的频率分布 Fig.1 Frequency distributions at different embedded rates:(a) classic frequency distribution;(b) singing frequency distribution 由于人耳对于低频声音敏感‚为了进一步提高 嵌入水印后的听觉质量‚应该减少水印在低频段的 嵌入量.在 MPEG-2AAC 中‚MDCT 系数根据心 理声学模型-Ⅱ从低频到高频被划分成了多个比例 因子频带‚因此可由 escape coding 发生所处的比例 因子带号来判断当前的频率段‚从而控制各频段上 的水印嵌入量.但通过实验发现‚由于大部分的 escape coding 发生在低频区域‚如果一味的控制低 频区的水印嵌入‚提高了听觉质量‚却使水印的嵌入 码率变得很小. 为了平衡水印的嵌入码率和不可感知性‚本文 利用 AAC 中根据心理声学模型计算出的感知熵 PE (perceptual entropy) [11] 作为另一嵌入条件.PE 表 示信号对噪声的容忍度.在 AAC 中‚当 PE 值大于 1800时表明该段音乐变化较大‚为避免失真 AAC 给它分配较多的比特数‚使用短窗(256个样本)来 进行编码;当 PE 小于1800时‚为提高编码效率使 用长窗(2048个样本)给信号编码.根据刘伟等[12] 的研究结果表明‚MP3压缩后的信噪比与 PE 值的 变化趋势一致‚即对 PE 较大的帧 MP3所产生的影 响较小‚因此在短窗信号中嵌入水印引起的失真较 小‚这一点同样适用于 AAC. 基于 escape coding 发生的频段和 PE 的大小‚ 本文对水印嵌入算法进行了改进:对 PE 小于1800 的短窗信号不限制水印嵌入量‚而对长窗信号则由 比例因子带号决定水印嵌入量(表5). 表5 长窗信号水印嵌入量控制 Table5 Watermark embedding control by long window signal 比例因子带号‚sb sb≤5 5<sb<20 20<sb 嵌入量/bit 0 10 无限制 经过码率控制后的水印嵌入结果如表6所示. 所有嵌入水印的音乐在听觉质量上都有了提高‚同 时不同音频水印嵌入码率的差异减小‚说明嵌入码 率更稳定. 3 水印提取 水印提取即水印嵌入的逆过程.在 Huffman 解 码之前‚找到所有使用码书号为11的 Huffman 码 字‚并判断该编码是否使用了 escape coding;根据嵌 入算法可以得到嵌入的水印值‚再将提取的水印通 过 Anorld 反变换[9]‚恢复成原来的图像. 4 实验结果 以 folk 文件为例‚水印图像(大小70×70)如 图2(a) 所 示‚实 际 嵌 入 的 水 印 量 是 6495 bit (图2(b))‚在音频文件没有受到攻击时‚水印可以 100%被提取出来(图2(c)).由于嵌入和提取算法 复杂度小‚嵌入和提取的速度很快‚几乎不会增加音 频文件压缩和解压缩的时间.虽然这种水印嵌入量 较大‚但由于只是对 Huffman 的 LSB 进行修改‚原 压缩音频的比特率不会增加. ·528· 北 京 科 技 大 学 学 报 第31卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有