特性来嵌入水印利用量化系数大于15的 Huffman 码字作为宿主进行嵌

正在加载图片...

526 北京科技大学学报第31卷特性来嵌入水印，利用量化系数大于15的Huffman 例因子频带，比例因子频带的划分尽可能地拟合人码字作为宿主进行嵌入，并在此基础上对嵌入算法耳的临界频带，心理声学模型用来估计每一个比例进行分析和改进，提高嵌入水印的不可感知性，因子频带的最大可允许失真，通过内外双层循环迭 Kim[对MP3文件使用Huffman编码嵌入水印的代计算出每个比例因子频带的量化步长，以此对方法为本文提供了思路 MDCT系数进行量化.量化步长一方面要满足编码 1MPEG一2AAC编码8] 使用的比特数小于可分配的比特数，另一方面还要使量化噪声在心理声学模型允许范围之内，然后用 1.1MPEG2AAC简介 Huffman编码对量化后的系数进行编码，最后进行为了达到更高的编码质量和效率，MPEG一2 比特流封装，得到压缩后的码流， AAC(先进音频编码)[8]打破了对MPEG一1layer3 1.2 Huffman编码 (MP3)的向下兼容性，在MPEG系统上进一步改进在AAC中的Huffman编码是一种无损编码并加入了很多新的功能，大大增强了编码的灵活度，需要进行Huffman编码的参数包括各子带的比例在保证音质的同时更大限度地压缩了码率因子和经过量化的MDCT谱线，对比例因子的编码 AAC编码可以分为频谱变换、量化、熵编码和比较简单.对谱系数进行Huffman编码时，AAC编比特流封装四步.首先，对输入的PCM信号分段，码一共使用了l2本码书.每个Huffman码书所能每帧信号通过改进的离散余弦变换(MDCT),输出表示的量化频谱系数的最大绝对值、不同码书中n 1024个频谱分量.再将这些频谱分量依据不同的重组的个数、是否有符号等情况如表1所示，采样率和变换块类型划分成数10个不同带宽的比表】Huffman码书 Table 1 Huffman codebook 码书序号 n重组最大绝对值有符号值码书序号 n重组最大绝对值有符号值 0 0 6 2 4 是 1 1 是 7 2 7 否 2 4 1 是 8 2 否 3 4 2 9 2 12 否 4 4 2 否 10 2 12 否是 11 2 16 否有两个码书需要特别说明：码书0专门针对在 N=0,得到的escape--sequence是“00000”，同理可个编码区内的各系数都为0的情况：码书11能够知1011111”的escape--sequence代表值为63的量表示绝对值大于等于16的量化值，在量化值大于化系数.escape--sequence反映了量化值的真实大或等于l6时，使用一种称为escape coding的机制来小，并且编码后的escape-sequence在解压端能够毫实现无损编码.这样量化系数可以用escape 无误差地被还原，这给水印的嵌入和提取提供条件. sequence来表示，escape sequence由以下几部分组 2水印嵌入成： escape sequence= 本文的水印嵌入是对Huffman码字进行修改， escape-prefix)<escape-separator(escape-word. 因此水印可以在音频压缩过程中嵌入，也可以在压缩好的AAC音频上直接嵌入·本文在压缩过程中其中，(escape--prefix)是一个由V位“l"来表示的序列escape-separator只有一位，固定用“0”来表嵌入水印，采用了视觉可辨的二值图像，这种水印在用于数字音频版权保护或对其内容的原始性进行校示，用来分隔(escape-prefix).和(escape-word; 验时具有视觉的直观性， (escape--word是一个N+4位的无符号整数，N保 2.1数字水印预处理证下面的式子成立：为了消除二维水印图像W的像素空间相关量化系数=2N+4十escape-word (1) 性，提高数字水印算法的鲁棒性，确保水印图像某一根据上面的式子可以知当量化系数为16时，部分受到破坏后仍能全部或部分地恢复水印，首先特性来嵌入水印利用量化系数大于15的 Huffman 码字作为宿主进行嵌入并在此基础上对嵌入算法进行分析和改进提高嵌入水印的不可感知性． Kim ［7］对 MP3文件使用 Huffman 编码嵌入水印的方法为本文提供了思路． 1 MPEG－2AAC 编码［8］ 1∙1 MPEG－2AAC 简介为了达到更高的编码质量和效率MPEG－2 AAC（先进音频编码）［8］打破了对 MPEG－1layer 3 （MP3）的向下兼容性在 MPEG 系统上进一步改进并加入了很多新的功能大大增强了编码的灵活度在保证音质的同时更大限度地压缩了码率． AAC 编码可以分为频谱变换、量化、熵编码和比特流封装四步．首先对输入的 PCM 信号分段每帧信号通过改进的离散余弦变换（MDCT ）输出 1024个频谱分量．再将这些频谱分量依据不同的采样率和变换块类型划分成数10个不同带宽的比例因子频带比例因子频带的划分尽可能地拟合人耳的临界频带．心理声学模型用来估计每一个比例因子频带的最大可允许失真．通过内外双层循环迭代计算出每个比例因子频带的量化步长以此对 MDCT 系数进行量化．量化步长一方面要满足编码使用的比特数小于可分配的比特数另一方面还要使量化噪声在心理声学模型允许范围之内然后用 Huffman 编码对量化后的系数进行编码最后进行比特流封装得到压缩后的码流． 1∙2 Huffman 编码在 AAC 中的 Huffman 编码是一种无损编码．需要进行 Huffman 编码的参数包括各子带的比例因子和经过量化的 MDCT 谱线对比例因子的编码比较简单．对谱系数进行 Huffman 编码时AAC 编码一共使用了12本码书．每个 Huffman 码书所能表示的量化频谱系数的最大绝对值、不同码书中 n 重组的个数、是否有符号等情况如表1所示．表1 Huffman 码书 Table1 Huffman codebook 码书序号 n 重组最大绝对值有符号值 0 － 0 － 1 4 1 是 2 4 1 是 3 4 2 否 4 4 2 否 5 2 4 是码书序号 n 重组最大绝对值有符号值 6 2 4 是 7 2 7 否 8 2 7 否 9 2 12 否 10 2 12 否 11 2 16 否有两个码书需要特别说明：码书0专门针对在一个编码区内的各系数都为0的情况；码书11能够表示绝对值大于等于16的量化值．在量化值大于或等于16时使用一种称为 escape coding 的机制来实现无损编码．这样量化系数可以用 escape sequence来表示escape sequence 由以下几部分组成： escape sequence＝〈escape－prefix〉〈escape－separator〉〈escape－word〉．其中〈escape－prefix〉是一个由 N 位“1”来表示的序列；〈escape－ separator〉只有一位固定用“0” 来表示用来分隔〈escape－ prefix〉和〈escape－ word〉；〈escape－word〉是一个 N＋4位的无符号整数N 保证下面的式子成立：量化系数＝2N＋4＋〈escape－word〉（1）根据上面的式子可以知当量化系数为16时 N＝0得到的 escape－sequence 是“00000”．同理可知“1011111”的 escape－sequence 代表值为63的量化系数．escape－ sequence 反映了量化值的真实大小并且编码后的 escape－sequence 在解压端能够毫无误差地被还原这给水印的嵌入和提取提供条件． 2 水印嵌入本文的水印嵌入是对 Huffman 码字进行修改因此水印可以在音频压缩过程中嵌入也可以在压缩好的 AAC 音频上直接嵌入．本文在压缩过程中嵌入水印采用了视觉可辨的二值图像这种水印在用于数字音频版权保护或对其内容的原始性进行校验时具有视觉的直观性． 2∙1 数字水印预处理为了消除二维水印图像 W 的像素空间相关性提高数字水印算法的鲁棒性确保水印图像某一部分受到破坏后仍能全部或部分地恢复水印首先 ·526· 北京科技大学学报第31卷

<<向上翻页向下翻页>>

点击下载：一种基于MPEG-2 AAC编码的音频水印方法