卷积神经网络用于远程语音识别
资料介绍:
卷积神经网络用于远程语音识别(中文5000字,英文PDF)
摘要
我们研究了卷积神经网络(CNNs)用于大词汇远程语音识别,从单个远程麦克风(SDM)到多个远程麦克风(MDM)记录的语音进行训练。在MDM情况下,我们探索了与直接使用多个声学通道作为CNN的并行输入相比,波束形成信号输入的表示方法,探索了不同的权重共享方法,并提出了一种双向汇集的信道方式卷积。我们在使用AMI会议语料库进行的实验中发现,相较于传统的深度神经网络(DNN),CNNs提高了6.5%的字错误率(WER),而相较于相差训练的高斯混合模型(GMM)基线,提高了15.7%。对于跨频道的CNN训练,相对于比较型DNN结构,WER提高了3.5%。而与最佳波束形成的GMM系统相比,跨频道卷积相对将WER降低了9.7%,并且达到了波束形成DNN的精度。
关键词:AMI语料库,卷积神经网络,深度神经网络,远程语音识别,会议。 [来源:http://Doc163.com]
[资料来源:http://doc163.com]