优化配置单元查询:Apache Hive

时间:2017-04-03 09:06:13

标签: hadoop hive query-tuning

以下配置单元查找单个列的超前和滞后。该查询产生1个Mapper和50个Reducers。如何优化查询以减少产生的效果。

表格说明

col_name        data_type       comment
# col_name              data_type               comment

a                       int

故事中的数据

 select * from foo;
OK

 foo.a 1 2 3 4 5 6 3 4 6 78 9 7 NULL
select lag(a,1) over (order by a) as next,lead(a,1) over (order by a) as prev from foo;
  

查询ID =   phodisvc_20170403015502_de129135-eb19-4c4d-8161-c3f217a45928总计   jobs = 1启动作业1中的1个减少任务数量不是   指定。默认为jobconf值:50为了改变   reducer的平均负载(以字节为单位):set   hive.exec.reducers.bytes.per.reducer =为了限制   最大减速器数:set hive.exec.reducers.max = In   为了设置一个恒定数量的reducer:set   mapreduce.job.reduces = Kill Command =   /opt/mapr/hadoop/hadoop-2.7.0/bin/hadoop job -kill   job_1489146839620_136214 Stage-1的Hadoop作业信息:number of   地图:1;减速机数量:50

0 个答案:

没有答案