Hive没有正确分离tsv文件

时间:2014-07-01 09:11:14

标签: hadoop hive

我有一个TSV文件并尝试通过;

将其加载到配置单元
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'   LINES TERMINATED BY '\n'
STORED AS TEXTFILE

这里有问题的部分虽然文件中包含“02 \ t \ t \ t \ t”这样的字符串。 因此,配置单元不会将它识别为制表符分隔,也不会将它们分开。 我想知道是否有一种方法可以让hive理解“\ t”字符串也应该是字段分隔的。我读过一本关于它的书,看到tsv也没有免费的serdes。

示例输入行:

8   fp\t\t\t     dj\t\t\t    5  amz ep 02\t\t\t ar\t

干杯,

0 个答案:

没有答案