我正在尝试将数据从文件移动到配置单元表中。文件中的数据如下所示: -
StringA StringB StringC StringD StringE
其中每个字符串由空格分隔。问题是我想要StringA,StringB和StringC的单独列和StringD的一列,即StringD和String E应该是同一列的一部分。如果我使用
ROW DELIMITED BY FIELDS TERMINATED BY ' '
,Hive会为StringD和StringE生成单独的列。 (StringD和StringE本身包含空格,而其他字符串本身不包含空格)
hive中是否有任何特殊语法可以实现此目的,还是需要以某种方式预处理我的数据文件?
答案 0 :(得分:1)
使用常规表达 https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-ApacheWeblogData 您可以定义何时使用空格作为分隔符以及何时使用数据