阅读背景:

站立会议_第二天

来源:互联网 

第一天    日期:2018/6/17

1.1 今日完成任务情况以及遇到的问题。

        实现推荐,其实也是解决许多海量数据处理相关的问题,例如在1亿个ip中找出访问次数前1000的ip,在海量搜索字符串中找出搜索频率排在前十的搜索字符串等等。我们刚开始根据查找的资料,打算从top-K入手实现推荐,但是在具体实现时遇到了困难。今天我们先从BFS爬虫算法入手,准备从相关网站爬取推荐信息。   




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: