正在加载图片...
124 智能系统学报 第7卷 一个脉冲.等级差异的计算公式是:△p=log(/ 制并且输入为0(无脉冲)后,细胞模型会变为激活 ),这里和。分别代表频道j的同侧和异侧声 状态 音等级.对于脉冲SD(△p),负的LD值意味着 MS0和LSO的输入 其他抑制性输人 声音等级将会是右耳的比左耳的低,正的LD值正 好相反.图6为ILD的重合模型,其中ipsi和contra 空置 是代表异侧的Gammatone频率通道, ScH(At ES LL 非激活 1 LL S(△t:月 Sm(△T-△1,)/0 ES 释放一个脉冲 持续时间内没有抑制性 或者变为抑制性 并且输人为0(月脉冲) 图5TD的重合模型 Fig.5 ITD coincidence model 激活 ipsi log 模型 Sn(△pfD 输出 contra 图7脑下丘的起始神经细胞模型 图6LD的重合模型 Fig.7 The IC's onset cell Fig.6 ILD coincidence model 再利用Onset Cell模型对多声源语音信号进行 由以上分析,在完成重合神经元之后,为了提取 分离时,要用到信号能量比,首先计算出神经细胞模 并融合TD和LD传递的语音信息,建立了2个加 型中语音信号的第i频率通道、第j时间帧能量 权阵列:TD。和LD。,在所有的频率范围内,利用乘 ∑S品4和噪声信号能量∑,然后计算出信 以一个二维的TD/LD的矩阵加权阵列计算出一 个加权的LD和TD映射. 号能量比: ∑(max(f/1200,1) ∑so ITD以= Eij max(f/1200,1) ∑s成w+∑ ILD,= max(log(f/1 000,0)) 如果E,>0,5,表明语音能量大于噪声能量,应该 ∑(max(logG/1000,0)) 保留这个语音占主导地位的信号片段;反之,如果E,< 式中:是频道指数.加权的TD和LD映射信息最 0.5,表明噪声能量占主导地位则应当舍去.然后再利 终被融合到一起,也就是MS0和LS0的输出信息, 用Omst细胞模型获取TD和LD的值,来构建掩蔽矩 最后被输入到脑下丘的神经细胞内进行语音信息的 阵,实现语音信号的分离.本文采用二值掩蔽,对于第 提取和分离, 通道、第j时间帧的掩蔽系数可以定义为 1.3脑下丘细胞模型 入(i,)= 脑下丘中一共有Rebound Regular、Rebound 1,f≤f,且[rmm(i)]>T(ij)]: Onse、/Sustained Regular、.Onset等几种细胞.本文根 1,f>f,且[L(i,)]>T0(iw)]: 据脑下丘的Onset神经细胞模型对多声源的语音信 0,其他. 号进行分离的特征,构造了Oneset Cell模型.图7是 式中f。=1.5kz,T)(i,)和T9(i,)分别是TD 脑下丘的Onst神经细胞模型的结构原理图, 和LD的阂值,r(i,j)是第i频率通道、第j时间 对于Onset Cell模型,每一个模型都有激活和 帧最大的时间延迟,L(i,》是第i频率通道、第j时 非激活2个状态.当细胞为激活状态时,模型被实施 间帧的LD值, 为F模型的神经元,直到释放了一个脉冲或者接 p(ij,)2 受一个抑制性的输入,然后细胞模型变为非激活状 L(i,)=20lg可 态.当为非激活状态时,也就是细胞模型为空置状 p.(ij,)2 态,直到细胞模型在一段持续时间t,内没有受到抑 式中:p(i,j,t)和p(iJj,t)分别为第i频率通道、第j
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有