我有数据集,它是制表符分隔的,并用新行终止。每行包含5个制表符分隔数据。 例如,数据集,
XXXX1 XXXX2 XXXX3 XXXX4 XXXX5
现在我必须创建一个包含3列的表,前两列将分别为第一行存储值XXXX1
和XXXX2
,第三列应包含剩余值XXXX3 XXXX4 XXXX5
。
我使用以下查询创建了表格,但在第三列中仅保留XXXX3
,其余两个数据未加载到表格中。
create table x(
id string, name string,country string, emails string
) row format delimited fields terminated by '\t';
请建议。
答案 0 :(得分:4)
tblproperties(' serialization.last.column.takes.rest' =' true')
create table x
(
id string, name string,country string, emails string
)
row format delimited
fields terminated by '\t'
stored as textfile
tblproperties ('serialization.last.column.takes.rest'='true')
;