用引号提取价值的有效方法"在Hive中有特殊字符列

时间:2017-07-17 11:11:57

标签: regex hive special-characters hiveql

关注this问题。我在HDFS中有一个表,其中包含特定列(字符串数组)的表,在其记录中的某处有特殊字符。 我在Hive中使用regex来提取第一个引号中的值(我使用case语句来检测是否有" - 我是正则表达式,否则我按原样返回列值)。但是,很可能是因为特殊字符在结果中有跳过和异常。我想问一下解决它的最有效方法是什么?在第一阶段清洁色谱柱(通过正则表达式,同时留下qoutation标记),然后使用我的正则表达式。或者说,有一种方法可以在一个正则表达式中使用它们吗?

0 个答案:

没有答案