拿来用,需要进行剪枝,缩小其规模,如仅使用出现频率大于阈值的n-gram,去掉一些高阶的n-grams等,另外在存储效率上,也可以改变存储的数据结构,改变数据类型等方法。对于这类大规模语料建立的语言模型,所用的平滑方法叫做Stupid backoff:如仅使用出现频率大于阈值的n-gram,去掉一些高阶的n-gram 你的当前访问异常,请进行认证后继续阅读剩余内容。 提交