阅读背景:

(翻译)Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks

来源:互联网 

写在前面:一个想法(如有不对的地方还请批评指正!)

对于平行语料库,由于utterances的内容是一致的,所以语音转换只需要对声学模型(Acoustic Model)建模并训练;而对于非平行语料库,由于utterances的内容不一致,所以才需要语言学模型(Linguistic Model)和声学模型(Acoustic Model)一起建模。对于平行语料库,由于utterances的内容是一




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: