大数据处理,大致可以分为两大模块: 离线数据处理:比如说电商、运营商出现的大批量的日志,可以由flume、sqoop或者其他路径,导入到HDFS中,然后经过数据清洗,使用Hive进行分析和处理,对于优化服务器资源等有很好的作用;个人觉得,支付宝的年账单就是离线数据处理的应用之处了。离线数据处理:比如说电商、运营商出现的大批量的 你的当前访问异常,请进行认证后继续阅读剩余内容。 提交