阅读背景:

初学Hadoop之计算TF-IDF值

来源:互联网 

1.词频

      TF(term frequency)词频,就是该分词在该文档中出现的频率,算法是:(该分词在该文档出现的次数)/(该文档分词的总数),这个值越大表示这个词越重要,即权重就越大。      TF(term frequency)词频,就是该分词在该文档中出现的




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: