阅读背景:

nutch v1.9源码分析(3)——nutch基本爬取流程

来源:互联网 

1      nutch基本爬取流程

         nutch是大名鼎鼎的Doug Cutting发起的爬虫项目,nutch孵化了现在大数据处理事实上的标准Hadoop。在nutch V 0.8.0 版本之前,Hadoop是nutch的一部分,从nutch V0.8.0开始,HDFS和MapReduce从nutch中剥离出成为Hadoop。v0.8.0之后,nutch就完全构建在Hadoop的基础之上了。         nutch是大名鼎鼎的




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: