在将数据加载到配置单元时从字段中删除引号

时间:2016-12-12 12:20:25

标签: hadoop hive hdfs

我想将带有输入数据的表加载到配置单元中。我有以下格式的数据。

100510;LOCAL CARD;;;;UNITED KINGDOM;GB;GBR;826
100515;LOCAL CARD;;;;NORWAY;NO;NOR;578
103753;LOCAL CARD;I&M BANK;DEBIT;PREPAID;KENYA;KE;KEN;404
104001;LOCAL CARD;LUXURY JEWELLERY CLASS (LJC) - TDFS;;;CANADA;CA;CAN;124

我想从hdfs在hive中加载此表,但因为某些列不包含数据,所以它在结果中给出了双引号。 我想忽略它们。

1 个答案:

答案 0 :(得分:0)

您可以使用serialization.null.format控制Hive如何处理空值。 要创建表格:

create table <your table>
<column list>
rowformat delimited fields terminated by <your delimiter>
TBLPROPERTIES ('serialization.null.format' = '');

更改现有表格

alter table <your table>  set TBLPROPERTIES ('serialization.null.format' = '');