Spark版本:1.6.2
概览
Spark SQL用于处置构造化数据,与Spark RDD API不同,它供给更多关于数据构造信息和盘算义务运行信息的接口,Spark SQL内部应用这些额外的信息完成特别优化。可以通过SQL、DataFrames API、Datasets API与Spark SQL进行交互,不管应用何种方法,SparkSQL应用统一的履行引擎记性处置。用户可以依据自己爱好,在不同API当选择适合的进行处置。本章中所有用例都可以在Spark SQL用于处置构造化数据,与Sp
Spark版本:1.6.2
Spark SQL用于处置构造化数据,与Spark RDD API不同,它供给更多关于数据构造信息和盘算义务运行信息的接口,Spark SQL内部应用这些额外的信息完成特别优化。可以通过SQL、DataFrames API、Datasets API与Spark SQL进行交互,不管应用何种方法,SparkSQL应用统一的履行引擎记性处置。用户可以依据自己爱好,在不同API当选择适合的进行处置。本章中所有用例都可以在Spark SQL用于处置构造化数据,与Sp