HIVE:在指定列之前应用分隔符

时间:2015-06-22 16:56:12

标签: hadoop datatable hive delimiter

我正在尝试将数据从文件移动到配置单元表中。文件中的数据如下所示: -

StringA StringB StringC StringD StringE

其中每个字符串由空格分隔。问题是我想要StringA,StringB和StringC的单独列和StringD的一列,即StringD和String E应该是同一列的一部分。如果我使用 ROW DELIMITED BY FIELDS TERMINATED BY ' ',Hive会为StringD和StringE生成单独的列。 (StringD和StringE本身包含空格,而其他字符串本身不包含空格)

hive中是否有任何特殊语法可以实现此目的,还是需要以某种方式预处理我的数据文件?

1 个答案:

答案 0 :(得分:1)

使用常规表达 https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-ApacheWeblogData 您可以定义何时使用空格作为分隔符以及何时使用数据