每个样本用1 6位表示，这样可以表示 9 6分贝的动态范围，差不多是从能听

点击下载：《计算机原理》课程教学资源：机械工业出版社《编码的奥秘》参考书籍（PDF电子书）第25章图形化革命

正在加载图片...

inaopub.com 第25章图形化革命 271 每个样本用16位表示,这样可以表示96分贝的动态范围,差不多是从能听到的声音的阀值(低于这一值则不能听见)到能忍受却不感到痛苦的声音的阀值的差。CD盘中用16位表示个样本所以,CD盘中每秒声音有44100个采样样本,每个样本2个字节。立体声则需要两倍的采样信息即每秒总共176400字节,每分10584000字节。(现在可以知道为什么在20世纪80年代之前声音的数字记录不是很普遍。)CD上74分钟的立体声需要783216000字节数字化声音与模拟声音相比具有很多众所周知的优点。特别是,无论何时复制模拟声音 (例如从录音磁带生成电唱片)都会有一些失真。而数字化声音是数字信息,总可以如实地转录和复制。过去常常是电话信号传输线路越长则声音越糟。现不再是这样了,因为现在许多电话系统都是数字的,跨越一个国家的呼叫信号就像跨越一条街道一样清晰 CD也可像存储声音一样来存储数据。用得最广泛的用来存放数据的CD称作CD-ROM (CD只读存储器),通常CD-ROM最多可存储约660MB。今天,许多计算机中都装有CD驱动器,许多应用程序和游戏都在CD-ROM中大约10年前,声音、音乐、视频开始进入个人计算机中,这称为多媒体。现在多媒体已经很普遍了,也不需要特别的名称。今天出售的许多家用计算机有声卡,内含一个ADC用来把从麦克风来的声音录制成数字,还有一个DAC用来通过喇叭播放录制的声音。声音可以以波形文件存放在磁盘中因为在家用计算机中录制和播放声音并不总是需要达到CD的质量,所以 Macintosh和 Windows提供低的采样速率,如22050、11025和8000赫兹,以及较小的8位样本信息和单频度录制。声音以每秒8000字节来录制,即每分480000字节。人们从科幻电影和电视中知道,未来的计算机可以用英语与用户交谈。一旦计算机有了数字化录制和播放声音的硬件,则所有通向这一目标的其他工作就可用软件来完成使计算机能讲人们能识别的单词和句子的方法有两种。一种方法是让人们录制句子段落短语、单词及数字,然后存储在文件中,并且用不同的方法串在一起。这种方法通常用在通过电话访问的信息系统中,它在只需播放有限的单词和数字组合的情况下能很好地工作种常见的声音合成形式涉及到一个用来把ASCI码字符转换成波形数据的进程。例如, 由于英语拼写并不总是一致的,所以这样的软件系统用一个词典或复杂算法来确定单词的确切发音。基本的音节(称作音素)组合成整个单词。通常软件需要做一些调整,例如,如果个句子后面跟着问号,则最后一个单词的声音频率必须增加声音识别——把波形数据转换成ASCI码字符——是一个更复杂的问题。的确,许多人在理解口语的方言方面有一些问题。在个人计算中使用听写软件时,通常需要训练以便能合理转录某个人所说的话。其中涉及的一个问题已超出了转换成ASCI码文本的范围,即编程使计算机“理解”所说的话。这个问题是人工智能的研究领域今天,计算机中的声卡也提供小的电子音乐合成器,它能模仿128种不同的音乐乐器和47 种不同的打击乐器,称作MIDI合成器。MID即乐器数字接口,在20世纪80年代早期由电子音乐合成器制造者协会开发出来,用来把这些电子乐器互相连接起来并连到计算机中。不同种类的MIDI合成器用不同的方法来合成乐器的声音,其中一些比另一些更逼真 MIDI合成器的性质已远远超过了MIDI定义的范畴。所要做的无非是通过演奏声音来响应短消息——通常长度为1、2或3字节。MIDI消息常常指明需要什么乐器、将要演奏哪个音符,或正每个样本用1 6位表示，这样可以表示 9 6分贝的动态范围，差不多是从能听到的声音的阀值（低于这一值则不能听见）到能忍受却不感到痛苦的声音的阀值的差。 C D盘中用1 6位表示一个样本。所以，C D盘中每秒声音有44 100个采样样本，每个样本2个字节。立体声则需要两倍的采样信息即每秒总共176 400字节，每分10 584 000字节。（现在可以知道为什么在2 0世纪8 0年代之前声音的数字记录不是很普遍。）C D上7 4分钟的立体声需要783 216 000字节。数字化声音与模拟声音相比具有很多众所周知的优点。特别是，无论何时复制模拟声音（例如从录音磁带生成电唱片）都会有一些失真。而数字化声音是数字信息，总可以如实地转录和复制。过去常常是电话信号传输线路越长则声音越糟。现不再是这样了，因为现在许多电话系统都是数字的，跨越一个国家的呼叫信号就像跨越一条街道一样清晰。 C D也可像存储声音一样来存储数据。用得最广泛的用来存放数据的 C D称作C D - R O M （C D只读存储器），通常C D - R O M最多可存储约6 6 0 M B。今天，许多计算机中都装有 CD 驱动器，许多应用程序和游戏都在 C D - R O M中。大约1 0年前，声音、音乐、视频开始进入个人计算机中，这称为多媒体。现在多媒体已经很普遍了，也不需要特别的名称。今天出售的许多家用计算机有声卡，内含一个 A D C用来把从麦克风来的声音录制成数字，还有一个 D A C用来通过喇叭播放录制的声音。声音可以以波形文件存放在磁盘中。因为在家用计算机中录制和播放声音并不总是需要达到 C D的质量，所以 M a c i n t o s h和 Wi n d o w s提供低的采样速率，如 22 050、11 025和8 0 0 0赫兹，以及较小的8位样本信息和单频度录制。声音以每秒8 0 0 0字节来录制，即每分480 000字节。人们从科幻电影和电视中知道，未来的计算机可以用英语与用户交谈。一旦计算机有了数字化录制和播放声音的硬件，则所有通向这一目标的其他工作就可用软件来完成。使计算机能讲人们能识别的单词和句子的方法有两种。一种方法是让人们录制句子段落、短语、单词及数字，然后存储在文件中，并且用不同的方法串在一起。这种方法通常用在通过电话访问的信息系统中，它在只需播放有限的单词和数字组合的情况下能很好地工作。一种常见的声音合成形式涉及到一个用来把 A S C I I码字符转换成波形数据的进程。例如，由于英语拼写并不总是一致的，所以这样的软件系统用一个词典或复杂算法来确定单词的确切发音。基本的音节（称作音素）组合成整个单词。通常软件需要做一些调整，例如，如果一个句子后面跟着问号，则最后一个单词的声音频率必须增加。声音识别—把波形数据转换成 A S C I I码字符—是一个更复杂的问题。的确，许多人在理解口语的方言方面有一些问题。在个人计算中使用听写软件时，通常需要训练以便能合理转录某个人所说的话。其中涉及的一个问题已超出了转换成 A S C I I码文本的范围，即编程使计算机“理解”所说的话。这个问题是人工智能的研究领域。今天，计算机中的声卡也提供小的电子音乐合成器，它能模仿 1 2 8种不同的音乐乐器和4 7 种不同的打击乐器，称作 M I D I合成器。M I D I即乐器数字接口，在2 0世纪8 0年代早期由电子音乐合成器制造者协会开发出来，用来把这些电子乐器互相连接起来并连到计算机中。不同种类的 M I D I合成器用不同的方法来合成乐器的声音，其中一些比另一些更逼真。 M I D I合成器的性质已远远超过了 M I D I定义的范畴。所要做的无非是通过演奏声音来响应短消息—通常长度为1、2或3字节。M I D I消息常常指明需要什么乐器、将要演奏哪个音符，或正第25章图形化革命 271 下载

<<向上翻页向下翻页>>

点击下载：《计算机原理》课程教学资源：机械工业出版社《编码的奥秘》参考书籍（PDF电子书）第25章图形化革命