正在加载图片...
526 北京科技大学学报 第31卷 特性来嵌入水印,利用量化系数大于15的Huffman 例因子频带,比例因子频带的划分尽可能地拟合人 码字作为宿主进行嵌入,并在此基础上对嵌入算法 耳的临界频带,心理声学模型用来估计每一个比例 进行分析和改进,提高嵌入水印的不可感知性, 因子频带的最大可允许失真,通过内外双层循环迭 Kim[对MP3文件使用Huffman编码嵌入水印的 代计算出每个比例因子频带的量化步长,以此对 方法为本文提供了思路 MDCT系数进行量化.量化步长一方面要满足编码 1MPEG一2AAC编码8] 使用的比特数小于可分配的比特数,另一方面还要 使量化噪声在心理声学模型允许范围之内,然后用 1.1MPEG2AAC简介 Huffman编码对量化后的系数进行编码,最后进行 为了达到更高的编码质量和效率,MPEG一2 比特流封装,得到压缩后的码流, AAC(先进音频编码)[8]打破了对MPEG一1layer3 1.2 Huffman编码 (MP3)的向下兼容性,在MPEG系统上进一步改进 在AAC中的Huffman编码是一种无损编码 并加入了很多新的功能,大大增强了编码的灵活度, 需要进行Huffman编码的参数包括各子带的比例 在保证音质的同时更大限度地压缩了码率 因子和经过量化的MDCT谱线,对比例因子的编码 AAC编码可以分为频谱变换、量化、熵编码和 比较简单.对谱系数进行Huffman编码时,AAC编 比特流封装四步.首先,对输入的PCM信号分段, 码一共使用了l2本码书.每个Huffman码书所能 每帧信号通过改进的离散余弦变换(MDCT),输出 表示的量化频谱系数的最大绝对值、不同码书中n 1024个频谱分量.再将这些频谱分量依据不同的 重组的个数、是否有符号等情况如表1所示, 采样率和变换块类型划分成数10个不同带宽的比 表】Huffman码书 Table 1 Huffman codebook 码书序号 n重组 最大绝对值 有符号值 码书序号 n重组 最大绝对值 有符号值 0 0 6 2 4 是 1 1 是 7 2 7 否 2 4 1 是 8 2 否 3 4 2 9 2 12 否 4 4 2 否 10 2 12 否 是 11 2 16 否 有两个码书需要特别说明:码书0专门针对在 N=0,得到的escape--sequence是“00000”,同理可 个编码区内的各系数都为0的情况:码书11能够 知1011111”的escape--sequence代表值为63的量 表示绝对值大于等于16的量化值,在量化值大于 化系数.escape--sequence反映了量化值的真实大 或等于l6时,使用一种称为escape coding的机制来 小,并且编码后的escape-sequence在解压端能够毫 实现无损编码.这样量化系数可以用escape 无误差地被还原,这给水印的嵌入和提取提供条件. sequence来表示,escape sequence由以下几部分组 2水印嵌入 成: escape sequence= 本文的水印嵌入是对Huffman码字进行修改, escape-prefix)<escape-separator(escape-word. 因此水印可以在音频压缩过程中嵌入,也可以在压 缩好的AAC音频上直接嵌入·本文在压缩过程中 其中,(escape--prefix)是一个由V位“l"来表示的序 列escape-separator只有一位,固定用“0”来表 嵌入水印,采用了视觉可辨的二值图像,这种水印在 用于数字音频版权保护或对其内容的原始性进行校 示,用来分隔(escape-prefix).和(escape-word; 验时具有视觉的直观性, (escape--word是一个N+4位的无符号整数,N保 2.1数字水印预处理 证下面的式子成立: 为了消除二维水印图像W的像素空间相关 量化系数=2N+4十escape-word (1) 性,提高数字水印算法的鲁棒性,确保水印图像某一 根据上面的式子可以知当量化系数为16时, 部分受到破坏后仍能全部或部分地恢复水印,首先特性来嵌入水印‚利用量化系数大于15的 Huffman 码字作为宿主进行嵌入‚并在此基础上对嵌入算法 进行分析和改进‚提高嵌入水印的不可感知性. Kim [7]对 MP3文件使用 Huffman 编码嵌入水印的 方法为本文提供了思路. 1 MPEG-2AAC 编码 [8] 1∙1 MPEG-2AAC 简介 为了达到更高的编码质量和效率‚MPEG-2 AAC(先进音频编码) [8]打破了对 MPEG-1layer 3 (MP3)的向下兼容性‚在 MPEG 系统上进一步改进 并加入了很多新的功能‚大大增强了编码的灵活度‚ 在保证音质的同时更大限度地压缩了码率. AAC 编码可以分为频谱变换、量化、熵编码和 比特流封装四步.首先‚对输入的 PCM 信号分段‚ 每帧信号通过改进的离散余弦变换(MDCT )‚输出 1024个频谱分量.再将这些频谱分量依据不同的 采样率和变换块类型划分成数10个不同带宽的比 例因子频带‚比例因子频带的划分尽可能地拟合人 耳的临界频带.心理声学模型用来估计每一个比例 因子频带的最大可允许失真.通过内外双层循环迭 代计算出每个比例因子频带的量化步长‚以此对 MDCT 系数进行量化.量化步长一方面要满足编码 使用的比特数小于可分配的比特数‚另一方面还要 使量化噪声在心理声学模型允许范围之内‚然后用 Huffman 编码对量化后的系数进行编码‚最后进行 比特流封装‚得到压缩后的码流. 1∙2 Huffman 编码 在 AAC 中的 Huffman 编码是一种无损编码. 需要进行 Huffman 编码的参数包括各子带的比例 因子和经过量化的 MDCT 谱线‚对比例因子的编码 比较简单.对谱系数进行 Huffman 编码时‚AAC 编 码一共使用了12本码书.每个 Huffman 码书所能 表示的量化频谱系数的最大绝对值、不同码书中 n 重组的个数、是否有符号等情况如表1所示. 表1 Huffman 码书 Table1 Huffman codebook 码书序号 n 重组 最大绝对值 有符号值 0 - 0 - 1 4 1 是 2 4 1 是 3 4 2 否 4 4 2 否 5 2 4 是 码书序号 n 重组 最大绝对值 有符号值 6 2 4 是 7 2 7 否 8 2 7 否 9 2 12 否 10 2 12 否 11 2 16 否 有两个码书需要特别说明:码书0专门针对在 一个编码区内的各系数都为0的情况;码书11能够 表示绝对值大于等于16的量化值.在量化值大于 或等于16时‚使用一种称为 escape coding 的机制来 实现 无 损 编 码.这 样 量 化 系 数 可 以 用 escape sequence来表示‚escape sequence 由以下几部分组 成: escape sequence= 〈escape-prefix〉〈escape-separator〉〈escape-word〉. 其中‚〈escape-prefix〉是一个由 N 位“1”来表示的序 列;〈escape- separator〉 只有一位‚固定用“0” 来表 示‚用来分隔〈escape- prefix〉和〈escape- word〉; 〈escape-word〉是一个 N+4位的无符号整数‚N 保 证下面的式子成立: 量化系数=2N+4+〈escape-word〉 (1) 根据上面的式子可以知当量化系数为16时‚ N=0‚得到的 escape-sequence 是“00000”.同理可 知“1011111”的 escape-sequence 代表值为63的量 化系数.escape- sequence 反映了量化值的真实大 小‚并且编码后的 escape-sequence 在解压端能够毫 无误差地被还原‚这给水印的嵌入和提取提供条件. 2 水印嵌入 本文的水印嵌入是对 Huffman 码字进行修改‚ 因此水印可以在音频压缩过程中嵌入‚也可以在压 缩好的 AAC 音频上直接嵌入.本文在压缩过程中 嵌入水印‚采用了视觉可辨的二值图像‚这种水印在 用于数字音频版权保护或对其内容的原始性进行校 验时具有视觉的直观性. 2∙1 数字水印预处理 为了消除二维水印图像 W 的像素空间相关 性‚提高数字水印算法的鲁棒性‚确保水印图像某一 部分受到破坏后仍能全部或部分地恢复水印‚首先 ·526· 北 京 科 技 大 学 学 报 第31卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有