阅读背景:

HIVE优化提示-如何写好HQL

来源:互联网 
一、     Hive join优化 1.     尽量将小表放在join的左边,我们这边使用的hive-0.12.0,所以是自动转化的,既把小表自动装入内存,执行map side join(性能好), 这是由参数hive.auto.convert.join=true 和hive.smalltable.filesize=25000000L)参数控制(默认是25M),如果表文件大小在25M左右,可以适当调整此参数,进行map side join,避免reduce side join。 也可以显示声明进行map join:特别适用于小表join大表的时候,SELECT /*+ MAPJOIN(b) */ a.key, a.value FROM a join b on a.key = b.key1.     尽量将小表放在join的左边,我们这边使用的hi


你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: