所以我有一个类似的蜂巢表:
Category ProductId
Cat1 prod1
Cat1 prod2
Cat1 prod3
Cat1 prod4
Cat2 prod5
Cat2 prod6
Cat2 prod7
类别是字符串类型,而ProductId是固定类型。
我正在尝试做一个:
INSERT OVERWRITE TABLE thesecondtable
SELECT collect_set(BASE64(ProductId)), Category
FROM thefirsttable GROUP BY Category;
我将avro模式中的第二个表声明为:
Category which is a string type. ProductId which is an array of strings.
现在,我收到一条错误消息:
Cannot convert column 0 from array<string> to array<binary>.
但是,我不知道avro模式是否具有二进制数据类型。有人可以建议如何解决该问题吗?谢谢!