正在加载图片...
inaopub.com 第25章图形化革命 271 每个样本用16位表示,这样可以表示96分贝的动态范围,差不多是从能听到的声音的阀 值(低于这一值则不能听见)到能忍受却不感到痛苦的声音的阀值的差。CD盘中用16位表示 个样本 所以,CD盘中每秒声音有44100个采样样本,每个样本2个字节。立体声则需要两倍的采 样信息即每秒总共176400字节,每分10584000字节。(现在可以知道为什么在20世纪80年代 之前声音的数字记录不是很普遍。)CD上74分钟的立体声需要783216000字节 数字化声音与模拟声音相比具有很多众所周知的优点。特别是,无论何时复制模拟声音 (例如从录音磁带生成电唱片)都会有一些失真。而数字化声音是数字信息,总可以如实地转 录和复制。过去常常是电话信号传输线路越长则声音越糟。现不再是这样了,因为现在许多 电话系统都是数字的,跨越一个国家的呼叫信号就像跨越一条街道一样清晰 CD也可像存储声音一样来存储数据。用得最广泛的用来存放数据的CD称作CD-ROM (CD只读存储器),通常CD-ROM最多可存储约660MB。今天,许多计算机中都装有CD驱动 器,许多应用程序和游戏都在CD-ROM中 大约10年前,声音、音乐、视频开始进入个人计算机中,这称为多媒体。现在多媒体已 经很普遍了,也不需要特别的名称。今天出售的许多家用计算机有声卡,内含一个ADC用来 把从麦克风来的声音录制成数字,还有一个DAC用来通过喇叭播放录制的声音。声音可以以 波形文件存放在磁盘中 因为在家用计算机中录制和播放声音并不总是需要达到CD的质量,所以 Macintosh和 Windows提供低的采样速率,如22050、11025和8000赫兹,以及较小的8位样本信息和单频 度录制。声音以每秒8000字节来录制,即每分480000字节。 人们从科幻电影和电视中知道,未来的计算机可以用英语与用户交谈。一旦计算机有了 数字化录制和播放声音的硬件,则所有通向这一目标的其他工作就可用软件来完成 使计算机能讲人们能识别的单词和句子的方法有两种。一种方法是让人们录制句子段落 短语、单词及数字,然后存储在文件中,并且用不同的方法串在一起。这种方法通常用在通 过电话访问的信息系统中,它在只需播放有限的单词和数字组合的情况下能很好地工作 种常见的声音合成形式涉及到一个用来把ASCI码字符转换成波形数据的进程。例如, 由于英语拼写并不总是一致的,所以这样的软件系统用一个词典或复杂算法来确定单词的确 切发音。基本的音节(称作音素)组合成整个单词。通常软件需要做一些调整,例如,如果 个句子后面跟着问号,则最后一个单词的声音频率必须增加 声音识别——把波形数据转换成ASCI码字符——是一个更复杂的问题。的确,许多人在 理解口语的方言方面有一些问题。在个人计算中使用听写软件时,通常需要训练以便能合理 转录某个人所说的话。其中涉及的一个问题已超出了转换成ASCI码文本的范围,即编程使计 算机“理解”所说的话。这个问题是人工智能的研究领域 今天,计算机中的声卡也提供小的电子音乐合成器,它能模仿128种不同的音乐乐器和47 种不同的打击乐器,称作MIDI合成器。MID即乐器数字接口,在20世纪80年代早期由电子音 乐合成器制造者协会开发出来,用来把这些电子乐器互相连接起来并连到计算机中。 不同种类的MIDI合成器用不同的方法来合成乐器的声音,其中一些比另一些更逼真 MIDI合成器的性质已远远超过了MIDI定义的范畴。所要做的无非是通过演奏声音来响应短消 息——通常长度为1、2或3字节。MIDI消息常常指明需要什么乐器、将要演奏哪个音符,或正每个样本用1 6位表示,这样可以表示 9 6分贝的动态范围,差不多是从能听到的声音的阀 值(低于这一值则不能听见)到能忍受却不感到痛苦的声音的阀值的差。 C D盘中用1 6位表示 一个样本。 所以,C D盘中每秒声音有44 100个采样样本,每个样本2个字节。立体声则需要两倍的采 样信息即每秒总共176 400字节,每分10 584 000字节。(现在可以知道为什么在2 0世纪8 0年代 之前声音的数字记录不是很普遍。)C D上7 4分钟的立体声需要783 216 000字节。 数字化声音与模拟声音相比具有很多众所周知的优点。特别是,无论何时复制模拟声音 (例如从录音磁带生成电唱片)都会有一些失真。而数字化声音是数字信息,总可以如实地转 录和复制。过去常常是电话信号传输线路越长则声音越糟。现不再是这样了,因为现在许多 电话系统都是数字的,跨越一个国家的呼叫信号就像跨越一条街道一样清晰。 C D也可像存储声音一样来存储数据。用得最广泛的用来存放数据的 C D称作C D - R O M (C D只读存储器),通常C D - R O M最多可存储约6 6 0 M B。今天,许多计算机中都装有 CD 驱动 器,许多应用程序和游戏都在 C D - R O M中。 大约1 0年前,声音、音乐、视频开始进入个人计算机中,这称为多媒体。现在多媒体已 经很普遍了,也不需要特别的名称。今天出售的许多家用计算机有声卡,内含一个 A D C用来 把从麦克风来的声音录制成数字,还有一个 D A C用来通过喇叭播放录制的声音。声音可以以 波形文件存放在磁盘中。 因为在家用计算机中录制和播放声音并不总是需要达到 C D的质量,所以 M a c i n t o s h和 Wi n d o w s提供低的采样速率,如 22 050、11 025和8 0 0 0赫兹,以及较小的8位样本信息和单频 度录制。声音以每秒8 0 0 0字节来录制,即每分480 000字节。 人们从科幻电影和电视中知道,未来的计算机可以用英语与用户交谈。一旦计算机有了 数字化录制和播放声音的硬件,则所有通向这一目标的其他工作就可用软件来完成。 使计算机能讲人们能识别的单词和句子的方法有两种。一种方法是让人们录制句子段落、 短语、单词及数字,然后存储在文件中,并且用不同的方法串在一起。这种方法通常用在通 过电话访问的信息系统中,它在只需播放有限的单词和数字组合的情况下能很好地工作。 一种常见的声音合成形式涉及到一个用来把 A S C I I码字符转换成波形数据的进程。例如, 由于英语拼写并不总是一致的,所以这样的软件系统用一个词典或复杂算法来确定单词的确 切发音。基本的音节(称作音素)组合成整个单词。通常软件需要做一些调整,例如,如果 一个句子后面跟着问号,则最后一个单词的声音频率必须增加。 声音识别—把波形数据转换成 A S C I I码字符—是一个更复杂的问题。的确,许多人在 理解口语的方言方面有一些问题。在个人计算中使用听写软件时,通常需要训练以便能合理 转录某个人所说的话。其中涉及的一个问题已超出了转换成 A S C I I码文本的范围,即编程使计 算机“理解”所说的话。这个问题是人工智能的研究领域。 今天,计算机中的声卡也提供小的电子音乐合成器,它能模仿 1 2 8种不同的音乐乐器和4 7 种不同的打击乐器,称作 M I D I合成器。M I D I即乐器数字接口,在2 0世纪8 0年代早期由电子音 乐合成器制造者协会开发出来,用来把这些电子乐器互相连接起来并连到计算机中。 不同种类的 M I D I合成器用不同的方法来合成乐器的声音,其中一些比另一些更逼真。 M I D I合成器的性质已远远超过了 M I D I定义的范畴。所要做的无非是通过演奏声音来响应短消 息—通常长度为1、2或3字节。M I D I消息常常指明需要什么乐器、将要演奏哪个音符,或正 第25章 图形化革命 271 下载
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有