阅读背景:

R语言文本挖掘之jieba分词与wordcloud展现

来源:互联网 

引言

由于语言的特殊性,中文在进行文本挖掘时需要进行分词,R中对中文分词支持较好的有jiebaR包(快速指南)和李键大哥的RWordseg包,从自己使用情况来看,jiebaR分词的效果要更好一些,本文就使用jiebaR包进行中文分词和去除停止词,再构建词频统计表,最后利用RWordseg进行词云可视化展现。



分享到: