从Hive中的列中丢弃启动器和终止符

时间:2018-04-02 10:44:11

标签: hadoop hive

我希望在加载到Hive(或加载到Hive之后)时从输入文件列中删除启动器([)和终结符(])。 该列包含一系列元素,例如:['a','b','c','d','e']

1 个答案:

答案 0 :(得分:0)

Hive主要处理分隔文件(列由分隔符分隔),或其他支持serdes的文件(json,regex,special csv等)。

所以你可以用以下任何一种方法做到这一点:

  1. 在将hive表加载到分隔格式之前清理数据。
  2. 使用正则表达式serde从模式[digit,digit,..]
  3. 中正确提取数据