如何使用两个分隔符在hive中加载数据

时间:2018-01-19 15:44:17

标签: hadoop hive bigdata hive-serde

我有格式

的样本记录

9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:8|M312:3|M183:3|M093,CD,49,

我想基于,|分隔符将数据加载到配置单元中。我搜索并提出了MultiDelimitSerDe。但我遇到的问题是一些记录将在M-starting字段中具有最小列,如

9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:4,CD,49,

此记录仅包含两个M-starting字段。我知道我们可以使用map-reduce工作来解决这个问题。但有没有办法通过单一查询有效地将数据加载到配置单元中?

0 个答案:

没有答案