Question

以下配置单元查找单个列的超前和滞后。该查询产生1个Mapper和50个Reducers。如何优化查询以减少产生的效果。

表格说明

col_name        data_type       comment
# col_name              data_type               comment

a                       int

故事中的数据

 select * from foo;
OK

 foo.a 1 2 3 4 5 6 3 4 6 78 9 7 NULL

select lag(a,1) over (order by a) as next,lead(a,1) over (order by a) as prev from foo;

查询ID = phodisvc_20170403015502_de129135-eb19-4c4d-8161-c3f217a45928总计 jobs = 1启动作业1中的1个减少任务数量不是指定。默认为jobconf值：50为了改变 reducer的平均负载（以字节为单位）：set hive.exec.reducers.bytes.per.reducer =为了限制最大减速器数：set hive.exec.reducers.max = In 为了设置一个恒定数量的reducer：set mapreduce.job.reduces = Kill Command = /opt/mapr/hadoop/hadoop-2.7.0/bin/hadoop job -kill job_1489146839620_136214 Stage-1的Hadoop作业信息：number of 地图：1;减速机数量：50

优化配置单元查询：Apache Hive

0 个答案: