前言
上篇文章讲述了如何从HDFS上拿到JobHistory的Job信息数据,固然如果能对这些数据进行二次剖析的话,将会得到更加精准的剖析成果.但是虽然说数据是有了,但究竟是Hadoop体系内部记载的数据,如果我想知道更加细粒度的数据,比如说,我想知道1个Task的在从运行开端到停止的进程中的gc情形,包含gc总次数,young gc,full gc次数,特别是full gc的次数,会直观的反应task的内存应用情形,明显这么细粒度的监控指标在JobHistory上是不会存在的.因此这点可以作为我们的一个优化目的,下面的正文部份教你如何添加新的自定义Counter.上篇文章讲述了如何从HDFS上拿到JobHistory的Job信息数据,固然如果能对这些数据进