Open Nav

统计参数语音合成中的后置滤波深度生成架构

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
   帮助中心
资料介绍:

统计参数语音合成中的后置滤波深度生成架构(中文11000字,英文PDF)
摘要—基于隐马尔可夫模型(HMM)的统计参数语音合成听起来仍是“闷”的。导致语音质量下降的一个原因可能是精细频谱结构的损失。在本文中,我们提出使用一个由深度神经网络(DNN)训练生成的深度生成架构来作为后置滤波器。网络模拟自然语音频谱的条件概率,给出合成语音频谱的条件概率来补偿合成与自然语音之间的差距。所提出的概率后置滤波器通过双向联想记忆(BAM)来级联两个限制玻尔兹曼机(RBM)或深度信念网络(DBN)来进行生成训练。我们设计了两种类型的DNN后置滤波器:一种在梅尔倒频谱域中操作,另一种在较高维度的频域中操作。我们将这两种新型的数据驱动后置滤波器与目前在语音合成中使用的其他类型的后置过滤器进行比较:基于固定的梅尔倒频谱的后置滤波器,基于全局方差的参数生成和基于调制频谱的增强。使用男性和女性演讲者的合成语音进行主观评估证实了所提出的基于DNN的后置滤波器在频域中与常规方法相比,显着提高了合成语音的分段质量。
关键词—深度生成架构,隐马尔可夫模型(HMM),调制频谱,后置滤波器,分段质量,语音合成

[资料来源:Doc163.com]

统计参数语音合成中的后置滤波深度生成架构

  [来源:http://www.doc163.com]

  • 关于资料
    提供的资料属本站所有,真实可靠,确保下载的内容与网页资料介绍一致.
  • 如何下载
    提供下载链接或发送至您的邮箱,资料可重复发送,若未收到请联系客服.
  • 疑难帮助
    下载后提供一定的帮助,收到资料后若有疑难问题,可联系客服提供帮助.
  • 关于服务
    确保下载的资料和介绍一致,如核实与资料介绍不符,可申请售后.
  • 资料仅供参考和学习交流之用,请勿做其他非法用途,转载必究,如有侵犯您的权利或有损您的利益,请联系本站,经查实我们会立即进行修正! 版权所有,严禁转载
    doc163.com Copyright © 2012-2024 苏ICP备2021029856号-4