阅读背景：

Flume的多层代理和防止数据丢失

发表于:2021-03-04

当我们用Flume采集日志时，由于数据源的多样性，则往往需要配置多个Flume进行采集，如果只是使用单层Flume的话，那么往往会产生很多个文件夹，单个文件夹也只是来自同一个节点的数据组成的。而实际开发中，为了减少HDFS的压力，同时提高后续MR的处理效率。往往会将同一组多个节点的数据汇聚到同一个文件中，这样同时也较少了数据从生产到分析的时间。当我们用Flume采集日志时，由于数据源的多样性，则往往需要配置多个Flume

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

LeetCode刷题day43

如何使用python 3解密SQLite数据库中的项目

inputStream 和 reader 区别

算法面试题-- 连接树的所有兄弟节点

原创：shiro 入门配置三步骤

ESP8266 AT指令开发(基于STC89C52单片机): 测试下诱人的程序（51单片机，8266，MQTT远程通信控制）

Android基础入门教程——2.1 View与ViewGroup的概念

前端练习--京东图片链接

Node.js+express+MySQL使用七牛云实现的用户头像修改

java socket保持长连接