本篇文章主要联合Spark-1.6.0的源码,对Spark中义务调度模块的履行进程进行剖析。Spark Application在遇到Action操作时才会真实的提交义务并进行盘算。这时候Spark会依据Action操作之前一系列Transform操作的关联关系,生成一个DAG,在后续的操作中,对DAG进行Stage划分,生成Task并终究运行。全部进程以下图所示,DAGScheduler用于对Application进行剖析,然后依据各RDD之间的依附关系划分Stage,依据这些划分好的Stage,对应每一个Stage会生成一组Task,将Task Set提交到TaskScheduler后,会由TaskScheduler启动Executor进行义务的盘算。 本篇文章主要联合Spark-1.6.0的源码,对Spark中义务调度模块的履行进程进行剖析。S