多语言语音合成:综述
资料介绍:
多语言语音合成:综述(中文17000字,英文PDF)
摘要
术语多语言语音合成是指以多种语言产生语音的过程来自单个文本到语音合成(TTS)系统的单个发言者的语音。本报告回顾文献中现有的努力来开发多语言TTS。 不同的方法在此描述审查主要侧重于开发一种自然,可理解且具有成本效益的TTS系统多语言文本输入。 由于多语言文本在TTS的所有应用中变得非常普遍,最近的重点是开发一种具有成本效益的多语言TTS系统,而不是传统的单语TTS。本综述还讨论了不同方法和提及的利弊克服限制的可能方向
1. 引言
文本到语音合成(TTS)处理转换输入文本消息到等效语音[1]。典型的TTS
系统有两个主要模块,文本分析和语音波形生成。在文本分析模块中,给出
输入文本通过语言检测算法,语言特定的字形到音素转换,并获得持续时间等韵律信息,
投球和压力。在语音波形生成中模块,语音波形由生成的语言规范生成。来自TTS的合成大小语音的优点通常用来衡量清晰度和自然度。可懂度是指如何消息内容是可理解的,而自然性指的是合成语音对人类语音的相似程度。因此,高度可理解任何实际的,自然语言都是最需要的应用。一个好的TTS系统会找到许多应用,如虚拟助手,虚拟新闻阅读器,有声读物中的故事,屏幕阅读器,电话服务,语音转换等。 [资料来源:http://doc163.com]
[资料来源:http://doc163.com]
[来源:http://Doc163.com]