以下配置单元查找单个列的超前和滞后。该查询产生1个Mapper和50个Reducers。如何优化查询以减少产生的效果。
表格说明
col_name data_type comment
# col_name data_type comment
a int
故事中的数据
select * from foo;
OK
foo.a 1 2 3 4 5 6 3 4 6 78 9 7 NULL
select lag(a,1) over (order by a) as next,lead(a,1) over (order by a) as prev from foo;
查询ID = phodisvc_20170403015502_de129135-eb19-4c4d-8161-c3f217a45928总计 jobs = 1启动作业1中的1个减少任务数量不是 指定。默认为jobconf值:50为了改变 reducer的平均负载(以字节为单位):set hive.exec.reducers.bytes.per.reducer =为了限制 最大减速器数:set hive.exec.reducers.max = In 为了设置一个恒定数量的reducer:set mapreduce.job.reduces = Kill Command = /opt/mapr/hadoop/hadoop-2.7.0/bin/hadoop job -kill job_1489146839620_136214 Stage-1的Hadoop作业信息:number of 地图:1;减速机数量:50