阅读背景:

FP-growth算法

来源:互联网 

应用FP-growth算法来高效发明频繁项集

前言

你用过搜索引擎挥发明这样一个功效:输入一个单词或单词的一部份,搜索引擎酒会主动补全查询词项,用户乃至实现都不知道搜索引擎推举的东西是不是存在,反而会去查找推举词项,比如在百度输入“为何”开端查询时,会涌现诸如“为何我有了变身器却不能变身奥特曼”之类幽默的推举成果,为了给出这些推举查询慈爱,搜索引擎公司的研讨人员应用了本篇文章要介绍的一个算法,他们通过查看互联网上的用词来找出常常在一块涌现的词对,这须要一种高效发明频繁集的办法。该算法称作FP-growth,又称为FP-增长算法,它比Apriori算法要快,它基于Apriori构建,但在完成雷同义务时采取了一些不同的技巧。不同于Apriori算法的”发生-测试”,这里的义务是将数据集存储在一个特定的称做FP树的构造以后发明频繁项集或频繁项对,即常在一块涌现的元素项的聚集FP树,这类做法是的算法的履行速度要快于apriori,通常性状要好两个数目级以上。你用过搜索引擎挥发明这样一个功效:输入




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: