我想加载没有行分隔符的固定宽度数据。我尝试了org.apache.hadoop.hive.contrib.serde2.RegexSerDe,如下所示:
create external table tbl_temp
(
f1 string,
f2 string,
f3 string,
f4 string,
f5 string,
f6 string,
f7 string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES ("input.regex" = "(.{3})(.{3})(.{2})(.{6})(.{1})(.{30})(.{5})")
LOCATION '/user/usrNm/dir1';
,数据就像
xxxyyyzzaaaaaabccccccc 11111xxxyyyzzaaaaaabccccccc 11111xxxyyyzzaaaaaabccccccc ccc
没有行分隔符。 当我执行选择时,仅显示1条记录。其他数据被忽略。 如何加载没有行分隔符的固定宽度文件。
谢谢