Hive - 按问题分组

时间:2014-07-18 00:17:02

标签: hadoop hive

我正在基于2个字段(A和B)在Hive中进行分组。但它没有为A和B的每个组合显示一个聚合值。

显示多个值,如

A B 1 A B 4 等

是因为减速器的数量超过1.我如何避免这个问题?

1 个答案:

答案 0 :(得分:0)

最近我遇到了类似的问题,在我的HQL中,我使用insert overwrite directory '$HQL_OUT_PATH'来覆盖输出。但它似乎不稳定导致重复项。你可以在HQL之前清理输出路径并查看如果输出结果是正确的。