下面是我创建的一个表格,其中复杂的数据类型放在复杂的数据类型中。
CREATE TABLE Family
(
name STRING,
marriages ARRAY < STRUCT <
wife: STRING,kids: ARRAY <STRING>>>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY ','
MAP KEYS TERMINATED BY ':'
LINES TERMINATED BY '\n';
我的数据是这样的:
Man1 Wife1:Kid1,Kid2,Kid3, Wife2:Kid4,Kid5,Kid6
Man2 Souse1:Child1,Child2, Souse2:Child3,Child4
加载表中的数据后,我只看到第一行的 Wife1,Kid1
和 Wife2,Kid4
。
第二行的 Spouse1:Child1
和 Spouse2:Child3
类似。
如果分隔符导致问题,那么我应该如何在此处插入多个孩子的名字?