热门搜索词：安卓APP MySQL Javaweb 三维建模机械手施工组织建筑结构单片机

统计参数语音合成中的后置滤波深度生成架构

来源：doc163.com 资料编号：DC24888 文件类型：资料等级： %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9ADC24888

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
密惠保帮助中心

资料介绍：

统计参数语音合成中的后置滤波深度生成架构(中文11000字,英文PDF)
摘要—基于隐马尔可夫模型(HMM)的统计参数语音合成听起来仍是“闷”的。导致语音质量下降的一个原因可能是精细频谱结构的损失。在本文中，我们提出使用一个由深度神经网络(DNN)训练生成的深度生成架构来作为后置滤波器。网络模拟自然语音频谱的条件概率，给出合成语音频谱的条件概率来补偿合成与自然语音之间的差距。所提出的概率后置滤波器通过双向联想记忆(BAM)来级联两个限制玻尔兹曼机(RBM)或深度信念网络(DBN)来进行生成训练。我们设计了两种类型的DNN后置滤波器：一种在梅尔倒频谱域中操作，另一种在较高维度的频域中操作。我们将这两种新型的数据驱动后置滤波器与目前在语音合成中使用的其他类型的后置过滤器进行比较：基于固定的梅尔倒频谱的后置滤波器，基于全局方差的参数生成和基于调制频谱的增强。使用男性和女性演讲者的合成语音进行主观评估证实了所提出的基于DNN的后置滤波器在频域中与常规方法相比，显着提高了合成语音的分段质量。
关键词—深度生成架构,隐马尔可夫模型(HMM),调制频谱,后置滤波器,分段质量,语音合成 [来源：http://Doc163.com]

[资料来源：Doc163.com]

以上是资料介绍,如需要完整的请充值下载

上一篇：中国航空运输的结构特性与多层网络

下一篇：参与和互动：视频理解的高阶对象交互

相关内容：

使用序列到序列模型生成高质量和信息性的对话响应	人机协作中快速动作识别和轨迹生成的相位估计
基于CSI的室内定位指纹识别：深度学习方法	基于深度学习模型的命名实体识别研究进展
一种用于图像幻灯片生成的联觉方法	基于生成对抗网络的图像翻译
适用于YouTube推荐的深度神经网络	使用微调深度网络融合的乳腺癌组织学图像分类
基于深度残差学习的图像识别	用于深度学习的进化神经自动机