蜂房返回类型的collect_set

时间:2018-06-29 17:36:30

标签: hive avro

所以我有一个类似的蜂巢表:

Category   ProductId
Cat1       prod1
Cat1       prod2
Cat1       prod3
Cat1       prod4
Cat2       prod5
Cat2       prod6
Cat2       prod7

类别是字符串类型,而ProductId是固定类型。

我正在尝试做一个:

INSERT OVERWRITE TABLE thesecondtable
SELECT collect_set(BASE64(ProductId)), Category
FROM thefirsttable GROUP BY Category;

我将avro模式中的第二个表声明为:

Category which is a string type. ProductId which is an array of strings.

现在,我收到一条错误消息:

Cannot convert column 0 from array<string> to array<binary>.

但是,我不知道avro模式是否具有二进制数据类型。有人可以建议如何解决该问题吗?谢谢!

0 个答案:

没有答案