我有一个TSV文件并尝试通过;
将其加载到配置单元ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE
这里有问题的部分虽然文件中包含“02 \ t \ t \ t \ t”这样的字符串。 因此,配置单元不会将它识别为制表符分隔,也不会将它们分开。 我想知道是否有一种方法可以让hive理解“\ t”字符串也应该是字段分隔的。我读过一本关于它的书,看到tsv也没有免费的serdes。
示例输入行:
8 fp\t\t\t dj\t\t\t 5 amz ep 02\t\t\t ar\t
干杯,