计算机工程与设计

自动化技术论文_一种用于因果式语音增强的门控

 

文章摘要:在传统的基于深度学习的语音增强方法中,为了提高网络对带噪语音的建模能力,通常会采用非因果式的网络输入。由于采用了非因果式的网络输入,导致语音增强系统产生了固定时延,不能满足实时语音增强的系统要求。针对这一问题,通过对现有网络结构的研究,提出了一种用于因果式语音增强的门控循环神经网络(causalgatedrecurrentnetwork,CGRU),解决了在实时语音增强系统中的固定时延问题,同时获得了较好的语音增强性能。为了更好地建模带噪语音信号的相关性,该网络单元当前时刻的输出融合了上一时刻的输入与输出。为了缓解网络训练过程中的过拟合问题,本文采用了线性门控机制,控制信息的传输。实验结果表明,所提方法在增强后的语音感知质量(PESQ),语音客观可懂度(STOI),分段信噪比(SSNR)等指标上均优于传统网络结构的语音增强方法。在信噪比SNR=0dB时的平均语音感知质量(PESQ)为:2.40,平均语音客观可懂度(STOI)为:0.786。

文章关键词:

项目基金: 上一篇:汽车工业论文_一种软件定义车载自组织网的QoS
下一篇:没有了