一、前言
在一个完整的大数据处理系统中,除了hdfs+mapreduce+hive组成的核心分析系统之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助系统在hadoop生态体系中都有便捷的开源框架。在一个完整的大数据处理系统中,除了hdfs+mapreduce+hive组成的核
在一个完整的大数据处理系统中,除了hdfs+mapreduce+hive组成的核心分析系统之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助系统在hadoop生态体系中都有便捷的开源框架。在一个完整的大数据处理系统中,除了hdfs+mapreduce+hive组成的核