Hadoop Cassandra Pig - 行计数查询运行速度很慢,只有1个地图任务

时间:2015-02-17 20:08:58

标签: hadoop cassandra apache-pig

我有一个4节点的Cassandra集群,它也是一个hadoop集群

当我运行pig脚本来选择和计算Cassandra表的行时 - 它创建带有1个map任务的hadoop作业 - 并且完成该作业需要很长时间。

为什么hadoop没有创建多个地图作业?

1 个答案:

答案 0 :(得分:0)

最可能的事情是,hadoop输入格式生成的分割足够大,可以覆盖整个令牌范围。尝试缩小输入分割大小,以便创建更多任务。