使用空间分隔符使用hue接口创建Hive表

时间:2015-12-29 08:57:35

标签: regex hadoop hiveql hue apache-hive

在hue-hive界面中使用文件创建表时,我们必须指定分隔符。 (Tab,Space,逗号等)。但我的文件由一个或多个空格分隔。如何指定分隔符以分隔一个或多个空格。

enter image description here

1 个答案:

答案 0 :(得分:0)

您可以通过以下方式创建表使用正则表达式作为分隔符:

数据,将数据放入hdfs

1  2 3   4
a   b  c d

创建表格

//grammar for create table
CREATE TABLE test1(
a string, 
b string, 
c string, 
d string
)
ROW FORMAT  SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'  WITH SERDEPROPERTIES  
(
"input.regex" ="([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)",
"output.format.string" = "%1$s %2$s %3$s %4$s"
)  
LOCATION '/test1/';