标签: join hadoop hive
我正在尝试加入hive中的两个大表。即使我将reducers的数量设置为500,但联接只发生在最后一个reducer上。由于工作被杀。 我明白同一把钥匙也属于相同的减速器。在这两个表中,都有许多唯一键。你能告诉我如何解决这个问题吗?还请你告诉我为什么map reduce会使用最后一个reducer来执行连接。