.tsv输出文件未在Hive中正确导入

时间:2015-10-19 18:36:59

标签: regex hadoop import hive hiveql

我正在尝试以.tsv格式导入配置单元查询结果,但它没有正确导入结果。我用putty终端进行交互。当我在hive环境中执行查询时,它给了我正确的结果,但是当我尝试使用以下命令在Hadoop环境中执行查询时,它不会捕获正确的结果。

hive -e"select substr(trim(split(column1,'\\|')[1]),1,1), column1, column2, from Table_X" > /home/test1.tsv

也许是因为正则表达式('|') ???

1 个答案:

答案 0 :(得分:0)

从命令提示符执行时,使用三反斜杠\\替换双反斜杠\\\

hive -e "select substr(trim(split('POS1 | 5P0011 | 36EB0395-4A75-49AB-BD9A-71DA1E2C114D |','\\\|')[1]),1,1)"