阅读背景:

YARN源码分析(八)-----Reduce Shuffle过程分析

来源:互联网 

前言

在Hadoop Job的各个运行过程中,Shuffle阶段一直是一个比较神秘的过程.因为Shuffle阶段是隶属于Reduce过程的子过程,所以很多时候会被人所忽略.但是Shffle的整个过程在map reduce的整个过程中起到1个数据过渡的作用.正因为这个模块的重要性,Hadoop把这个模块设置成了可插拔的模块,用户可以根据自己应用的类型特点,定制自己的Shuffle模块代码.之前粗粗的阅读了一下相关的代码,于是写一些内容记录一下所学的.在Hadoop Job的各个运行过程中,Shuffle阶段一直是一个比较神秘的过程.




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: