阅读背景:

Hadoop全链路监控解决方案

来源:互联网 

前言

我在最近的几篇文章中都或多或少的提到了一个很主要的词-"监控".为何要提到这个词呢,由于如果你和我一样是一位大数据工程师,你手下管理着批量的集群机器,并且同时这个集群的规模还会不定时的扩展,机器一旦变多,发生问题的频率和类型就会变多,所以这是,你靠人肉去剖析某台机器上的日志,OK,1台机器,2台机器,尚且可以解决方法,但是100台,1000台呢,固然如果工程师还这么做的话,我想他会抓狂的.所以如何做到智能化发明问题,定位问题,就显得很症结了,最幻想的成果是,你具有你的集群机器中每天跑的job的各种指标数据,然后你动动鼠标,通过展现出来的图形界面,就快速的发明了问题.这也是正是我最近在做的一件事情,后果还算不错.下面是我近1个月来,对我们部门的Hadoop集群做的一些监控方面的事情,谈不上高大上的构造,我们是如何以最简略的方法到达最大化的后果,愿望能给大家带来赞助.我在最近的几篇文章中都或多或少的提到了一个很主要的词-"监控".为何要提到这个词呢,由于如果你




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: