标签: hadoop cassandra apache-pig
我有一个4节点的Cassandra集群,它也是一个hadoop集群
当我运行pig脚本来选择和计算Cassandra表的行时 - 它创建带有1个map任务的hadoop作业 - 并且完成该作业需要很长时间。
为什么hadoop没有创建多个地图作业?
答案 0 :(得分:0)
最可能的事情是,hadoop输入格式生成的分割足够大,可以覆盖整个令牌范围。尝试缩小输入分割大小,以便创建更多任务。