表上只有3条记录的datastax hive select count(*),但需要1小时才能计数(),为什么?

时间:2013-09-16 20:04:33

标签: hadoop hive datastax-enterprise

蜂房> select * from example; OK
1你好杨 2你好熊
3 aaa
所用时间:51.273秒 - >没关系!
蜂房>从示例中选择count(key);
总MapReduce工作= 1 从1开始工作1 开始工作= job_201309170341_0001,跟踪网址= ...
杀死命令= / usr / bin / dse hadoop job -Dmapred.job.tracker = 10.10.5.153:8012 -kill job_201309170341_0001
Stage-1的Hadoop职位信息: mappers的数量:1537 ;减速机数量:1

然后等待1小时,我得到计数​​:3!

为什么需要这么多时间?为什么地图如此之大:1537?

1 个答案:

答案 0 :(得分:2)

你启用了vnodes吗?看起来你启用了vnode。我们正在开发关于vnodes的支持hadoop,但在它完成之前,建议为hadoop数据中心/集群禁用它