我有一个日志文件,其中包含以下格式的数据
1.1.someData.10.4
1.3.someData.true
我创建了一个表并使用了GrokSerDe,
CREATE EXTERNAL TABLE my_table
(col_1 string,col_2 string)ROW FORMAT SERDE'com.amazonaws.glue.serde.GrokSerDe'with SERDEPROPERTIES('input.grokCustomPatterns'='TEST((?:(?: 1)。[。])someData [。]%{GREEDYDATA:col_1} |(?:(?:1)。[。])someData [。]%{GREEDYDATA:col_2})','input.format'= '%{TEST}')存储为INPUTFORMAT'org.apache.hadoop.mapred.TextInputFormat'OUTPUTFORMAT'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'LOCATION's3:// location /';
实际输出
col_1 col_2
10.4
真
我希望采用以下格式
col_1 col_2
10.4
true