124 智能系统学报第7卷一个脉冲.等级差异的计算公式是：△p=log

正在加载图片...

124 智能系统学报第7卷一个脉冲.等级差异的计算公式是：△p=log(/ 制并且输入为0（无脉冲）后，细胞模型会变为激活 ),这里和。分别代表频道j的同侧和异侧声状态音等级.对于脉冲SD(△p),负的LD值意味着 MS0和LSO的输入其他抑制性输人声音等级将会是右耳的比左耳的低，正的LD值正好相反.图6为ILD的重合模型，其中ipsi和contra 空置是代表异侧的Gammatone频率通道， ScH(At ES LL 非激活 1 LL S(△t:月 Sm(△T-△1，)/0 ES 释放一个脉冲持续时间内没有抑制性或者变为抑制性并且输人为0（月脉冲）图5TD的重合模型 Fig.5 ITD coincidence model 激活 ipsi log 模型 Sn(△pfD 输出 contra 图7脑下丘的起始神经细胞模型图6LD的重合模型 Fig.7 The IC's onset cell Fig.6 ILD coincidence model 再利用Onset Cell模型对多声源语音信号进行由以上分析，在完成重合神经元之后，为了提取分离时，要用到信号能量比，首先计算出神经细胞模并融合TD和LD传递的语音信息，建立了2个加型中语音信号的第i频率通道、第j时间帧能量权阵列：TD。和LD。,在所有的频率范围内，利用乘 ∑S品4和噪声信号能量∑，然后计算出信以一个二维的TD/LD的矩阵加权阵列计算出一个加权的LD和TD映射. 号能量比： ∑(max(f/1200,1) ∑so ITD以= Eij max(f/1200,1) ∑s成w+∑ ILD,= max(log(f/1 000,0)) 如果E,>0,5,表明语音能量大于噪声能量，应该 ∑(max(logG/1000,0)) 保留这个语音占主导地位的信号片段；反之，如果E,< 式中：是频道指数.加权的TD和LD映射信息最 0.5,表明噪声能量占主导地位则应当舍去.然后再利终被融合到一起，也就是MS0和LS0的输出信息，用Omst细胞模型获取TD和LD的值，来构建掩蔽矩最后被输入到脑下丘的神经细胞内进行语音信息的阵，实现语音信号的分离.本文采用二值掩蔽，对于第提取和分离，通道、第j时间帧的掩蔽系数可以定义为 1.3脑下丘细胞模型入(i,)= 脑下丘中一共有Rebound Regular、Rebound 1,f≤f,且[rmm(i)]>T(ij)]: Onse、/Sustained Regular、.Onset等几种细胞.本文根 1,f>f,且[L(i,)]>T0(iw)]: 据脑下丘的Onset神经细胞模型对多声源的语音信 0,其他. 号进行分离的特征，构造了Oneset Cell模型.图7是式中f。=1.5kz,T)(i,)和T9(i,)分别是TD 脑下丘的Onst神经细胞模型的结构原理图，和LD的阂值，r(i,j)是第i频率通道、第j时间对于Onset Cell模型，每一个模型都有激活和帧最大的时间延迟，L(i,》是第i频率通道、第j时非激活2个状态.当细胞为激活状态时，模型被实施间帧的LD值，为F模型的神经元，直到释放了一个脉冲或者接 p(ij,)2 受一个抑制性的输入，然后细胞模型变为非激活状 L(i,)=20lg可态.当为非激活状态时，也就是细胞模型为空置状 p.(ij,)2 态，直到细胞模型在一段持续时间t,内没有受到抑式中：p(i,j,t)和p(iJj,t)分别为第i频率通道、第j

<<向上翻页向下翻页>>

点击下载：机器感知与模式识别：多个声源下基于人耳听觉特性的语音分离