标签: hadoop hive
我正在基于2个字段(A和B)在Hive中进行分组。但它没有为A和B的每个组合显示一个聚合值。
显示多个值,如
A B 1 A B 4 等
是因为减速器的数量超过1.我如何避免这个问题?
答案 0 :(得分:0)
最近我遇到了类似的问题,在我的HQL中,我使用insert overwrite directory '$HQL_OUT_PATH'来覆盖输出。但它似乎不稳定导致重复项。你可以在HQL之前清理输出路径并查看如果输出结果是正确的。
insert overwrite directory '$HQL_OUT_PATH'