Hive数据加载

时间:2017-08-17 18:12:11

标签: hadoop hive hiveql

我有数据集,它是制表符分隔的,并用新行终止。每行包含5个制表符分隔数据。 例如,数据集,

XXXX1 XXXX2 XXXX3 XXXX4 XXXX5

现在我必须创建一个包含3列的表,前两列将分别为第一行存储值XXXX1XXXX2,第三列应包含剩余值XXXX3 XXXX4 XXXX5

我使用以下查询创建了表格,但在第三列中仅保留XXXX3,其余两个数据未加载到表格中。

create table x( 
id string, name string,country string, emails string
) row format delimited fields terminated by '\t';

请建议。

1 个答案:

答案 0 :(得分:4)

tblproperties(' serialization.last.column.takes.rest' =' true')

create table x
(
     id string, name string,country string, emails string
)
row format delimited
fields terminated by '\t'
stored as textfile
tblproperties ('serialization.last.column.takes.rest'='true')
;