正在加载图片...
第8卷第4期 智能系统学报 Vol.8 No.4 2013年8月 CAAI Transactions on Intelligent Systems Aug.2013 D0I:10.3969/i.issn.1673-4785.201304049 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20130621.1541.002.html 基于DIVA模型的语音-映射单元自动获取 张少白,刘欣 (南京邮电大学计算机学院,江苏南京210046) 摘要:针对DIVA模型中存在的“感知能力与语音生成技巧发育不平衡”问题,提出了一种自动获取语音-映射单 元的方法该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中21维度的听觉存储空间相关 联,对不同听觉的不同反应,分别考虑其频带的屏蔽效应、听觉响度与频率的关系在读取语音输入信号的过程中,模 型能较好地获得初始听觉表示,其方式与婴儿咿呀学语的过程基本一致仿真实验表明,通过边界定义、相似性比较 以及搜索更新等步骤,此方法能很好地进行初始输入模式的自组织匹配,并最终使DVA模型更具语音获取的自然 特性。 关键词:DIVA模型:音素:语音-映射单元:语音生成与获取 中图分类号:TP31 文献标志码:A文章编号:1673-4785(2013)04-0305-07 中文引用格式:张少白,刘欣.基于DVA模型的语音-映射单元自动获取[J].智能系统学报,2013,8(4):305-311. 英文引用格式:ZHANG Shaobai,LIU Xin.Automatic acquisition of speech sound-target cells based on DIVA model[J].CAAI Transactions on Intelligent Systems,2013,8(4):305-311. Automatic acquisition of speech sound-target cells based on DIVA model ZHANG Shaobai,LIU Xin (College of Computer,Nanjing University of Posts and Telecommunications,Nanjing 210046,China) Abstract:Contraposing the shortage of Directions Into Velocities of Articulators (DIVA)model about"infants per- ceptual abilities do develop faster at first than their speech production skills",the paper presents an automatic ac- quisition method of speech sound-target cells.The method simulates the human ear as a parallel band-pass filter group with different bandwidth and associates respectively;the filter with the 21-dimensional storage space of audi- tory sense in DIVA model.This method was done in order for different auditory reactions,the shielding effect of fre- quency band,sound loudness,and frequency relation could be considered respectively for this study.In the process of reading the input signal of speech,the model can acquire good initial hearing and the process is consistent with baby's babble.The simulation results show that through boundary definition,similarity comparison,searching and updates and so on,the method has nicer self-organized pattern matching effect for initial input,which makes the DIVA model a more natural characteristic regarding speech acquisition. Keywords:DIVA model;phoneme;speech sound-target cells;speech acquisition and production 在神经解剖学和神经心理学层次上,仿真和描述的成果.其中,波斯顿大学语音实验室F.H.Guenther 大脑中涉及语音生成和理解区域的相关功能,这是近 教授带领的研究小组所做的工作最具代表性和开创 来人工语音合成系统所追求的主要思想围绕这样的 性.他们研制成功了一种称之为“神经分析系统(neu- 主题思想,多年来许多学者在语音生成和获取计算模 ralynx system)”的仪器,让使用者只需简单想一想自 型的研究和探讨方面做出了巨大努力,并获得了丰硕 己所希望表达的语言,语音合成系统就能将其内容直 接转换成语音.通过与“脑-计算机”系统(brain-com- 收稿日期:2013-04-16.网络出版日期:2013-06-21 puter interface,BCI)相结合,使用者可以直接控制声 基金项目:国家自然科学基金资助项目(61073115,61271334, 音的输出,其反应速度比著名科学家霍金目前正在使 61373065). 通信作者:张少白.E-mail:adzsb@163.com 用的打字处理方式快了许多.第 8 卷第 4 期 智 能 系 统 学 报 Vol.8 №.4 2013 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2013 DOI:10.3969 / j.issn.1673⁃4785.201304049 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20130621.1541.002.html 基于 DIVA 模型的语音-映射单元自动获取 张少白,刘欣 (南京邮电大学 计算机学院,江苏 南京 210046) 摘 要:针对 DIVA 模型中存在的“感知能力与语音生成技巧发育不平衡”问题,提出了一种自动获取语音-映射单 元的方法.该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中 21 维度的听觉存储空间相关 联,对不同听觉的不同反应,分别考虑其频带的屏蔽效应、听觉响度与频率的关系.在读取语音输入信号的过程中,模 型能较好地获得初始听觉表示,其方式与婴儿咿呀学语的过程基本一致.仿真实验表明,通过边界定义、相似性比较 以及搜索更新等步骤,此方法能很好地进行初始输入模式的自组织匹配,并最终使 DIVA 模型更具语音获取的自然 特性. 关键词:DIVA 模型;音素;语音-映射单元;语音生成与获取 中图分类号:TP31 文献标志码:A 文章编号:1673⁃4785(2013)04⁃0305⁃07 中文引用格式:张少白,刘欣.基于 DIVA 模型的语音-映射单元自动获取[J]. 智能系统学报, 2013, 8(4): 305⁃311. 英文引用格式:ZHANG Shaobai,LIU Xin. Automatic acquisition of speech sound⁃target cells based on DIVA model[ J]. CAAI Transactions on Intelligent Systems, 2013, 8(4): 305⁃311. Automatic acquisition of speech sound⁃target cells based on DIVA model ZHANG Shaobai, LIU Xin (College of Computer, Nanjing University of Posts and Telecommunications, Nanjing 210046, China) Abstract: Contraposing the shortage of Directions Into Velocities of Articulators (DIVA) model about “infants per⁃ ceptual abilities do develop faster at first than their speech production skills”, the paper presents an automatic ac⁃ quisition method of speech sound⁃target cells. The method simulates the human ear as a parallel band⁃pass filter group with different bandwidth and associates respectively; the filter with the 21⁃dimensional storage space of audi⁃ tory sense in DIVA model. This method was done in order for different auditory reactions, the shielding effect of fre⁃ quency band, sound loudness, and frequency relation could be considered respectively for this study. In the process of reading the input signal of speech, the model can acquire good initial hearing and the process is consistent with baby's babble. The simulation results show that through boundary definition, similarity comparison, searching and updates and so on, the method has nicer self⁃organized pattern matching effect for initial input, which makes the DIVA model a more natural characteristic regarding speech acquisition. Keywords:DIVA model; phoneme; speech sound⁃target cells; speech acquisition and production 收稿日期:2013⁃04⁃16. 网络出版日期:2013⁃06⁃21. 基金 项 目: 国 家 自 然 科 学 基 金 资 助 项 目 ( 61073115, 61271334, 61373065). 通信作者:张少白. E⁃mail:adzsb@ 163.com. 在神经解剖学和神经心理学层次上,仿真和描述 大脑中涉及语音生成和理解区域的相关功能,这是近 来人工语音合成系统所追求的主要思想.围绕这样的 主题思想,多年来许多学者在语音生成和获取计算模 型的研究和探讨方面做出了巨大努力,并获得了丰硕 的成果.其中,波斯顿大学语音实验室 F.H.Guenther 教授带领的研究小组所做的工作最具代表性和开创 性.他们研制成功了一种称之为“神经分析系统(neu⁃ ralynx system)”的仪器,让使用者只需简单想一想自 己所希望表达的语言,语音合成系统就能将其内容直 接转换成语音.通过与“脑-计算机”系统 (brain⁃com⁃ puter interface,BCI)相结合,使用者可以直接控制声 音的输出,其反应速度比著名科学家霍金目前正在使 用的打字处理方式快了许多.
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有