阅读背景:

Flume的多层代理和防止数据丢失

来源:互联网 

        当我们用Flume采集日志时,由于数据源的多样性,则往往需要配置多个Flume进行采集,如果只是使用单层Flume的话,那么往往会产生很多个文件夹,单个文件夹也只是来自同一个节点的数据组成的。而实际开发中,为了减少HDFS的压力,同时提高后续MR的处理效率。往往会将同一组多个节点的数据汇聚到同一个文件中,这样同时也较少了数据从生产到分析的时间。  当我们用Flume采集日志时,由于数据源的多样性,则往往需要配置多个Flume




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: