阅读背景:

基于WFST的语音识别解码器

来源:互联网 

学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统,在设备上通过MIC讲话,连着设备的PC的console上就能基本实时显示出讲话的内容。由于我们都是小白,刚开始可以要求低些,就用传统的GMM-HMM,能实现孤立词识别就算达标了,后面随着这方面能力的提高,再做更难一点的。任务下达后我根据之前对kaldi的简单理解把模块分成了三部分:数据准备和MFCC、GMM-HMM、解码网络创建和解码,由三个人每人负责一部分学习,掌握基本原理,搞清楚有哪些事情要做。在其他两个同学先挑了模块后就由我来负责解码网络构建和解码部分了。学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统,在设备上通过MIC讲话,连




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: