删除Oracle中值不同的子字符串

时间:2016-03-21 18:47:39

标签: regex oracle

我在Oracle中有一个列,最多可包含5个单独的值,每个值用'|'分隔。任何值都可以存在或丢失。以下是数据外观的示例:

100-1
10-3|25-1|120/240
15-1|15-3|15-2|120/208
15-1|15-3|15-2|120/208|STA-2
112-123|120/208|STA-3

除订单外,价值是任意的。用破折号分隔的数值总是先行。可以存在1到3个这些值。接下来是斜线(如果存在)分隔的数值。字符串“STA”和由短划线分隔的数值始终为最后一个(如果存在)。

我想要做的是将此列重新格式化为仅包含前三个可能的值,即由破折号分隔的三个数值。之后,我想使用以下模式替换每个值中的第二个数字(短划线后面的数字):

1 = A
2 = B
3 = C

我还想删除之后的短划线,但不会删除分隔值的'|',除非有尾随'|'

为了给你一个想法,这里是帖子开头的值在重新格式化之后的样子:

100A
10C|25A
15A|15C|15B
15A|15C|15B
112ABC

我认为这可以用正则表达式完成,但它让我有点困惑。有没有人有解决方案?

2 个答案:

答案 0 :(得分:1)

如果我必须解决这个问题,我会以下列方式解决。

SELECT
  REGEXP_REPLACE(column,'\|\d+\/\d+(\|STA-\d+)?',''),
  REGEXP_REPLACE(column,'(\d+)-(1)([^\d])','\1A\3'),
  REGEXP_REPLACE(column,'(\d+)-(2)([^\d])','\1B\3'),
  REGEXP_REPLACE(column,'(\d+)-(3)([^\d])','\1C\3'),
  REGEXP_REPLACE(column,'(\d+)-(123)([^\d])','\1ABC')
FROM table;

说明:让我们逐个细分每个REGEXP_REPLACE声明。

  1. REGEXP_REPLACE(column,'\|\d+\/\d+(\|STA-\d+)?','')  
    这将使用空字符串替换120/208|STA-2之类的末尾部分,以便进一步处理。

  2. 查找匹配很简单,但替换A的{​​{1}},1取代B2替换C是不可能的(据我所知)所以我分别做了那些匹配和替换。

    在第二个语句3的每个正则表达式中,第一个组是(\d+)-(yourNumber)([^\d])之前的数字,然后-yourNumber123后跟123

    因此,替换将根据|

  3. All demos here from version 1 to 5.

    注意: - 我刚刚替换了有问题的人yourNumber的组合。您也可以为其他组合做同样的事情。

答案 1 :(得分:0)

您可以在一行中执行此操作,但您可以编写简单的功能来执行此操作

SELECT str, REGEXP_REPLACE(str,'(\|\d+\/\d+)?(\|STA-\d+)?','') cut
, REGEXP_REPLACE(REGEXP_REPLACE(str,'(\|\d+\/\d+)?(\|STA-\d+)?',''), '(\-)([1,2]*)(3)([1,2]*)', '\1\2C\4') rep3toC
, REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(str,'(\|\d+\/\d+)?(\|STA-\d+)?',''), '(\-)([1,2]*)(3)([1,2]*)', '\1\2C\4'), '(\-)([1,C]*)(2)([1,C]*)', '\1\2B\4') rep2toB
, REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(str,'(\|\d+\/\d+)?(\|STA-\d+)?',''), '(\-)([1,2]*)(3)([1,2]*)', '\1\2C\4'), '(\-)([1,C]*)(2)([1,C]*)', '\1\2B\4'), '(\-)([B,C]*)(1)([B,C]*)', '\1\2A\4') rep1toA
, REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(str,'(\|\d+\/\d+)?(\|STA-\d+)?',''), '(\-)([1,2]*)(3)([1,2]*)', '\1\2C\4'), '(\-)([1,C]*)(2)([1,C]*)', '\1\2B\4'), '(\-)([B,C]*)(1)([B,C]*)', '\1\2A\4'), '-', '') "rep-"
FROM (
SELECT '100-1' str FROM dual UNION 
SELECT '10-3|25-1|120/240' str FROM dual UNION 
SELECT '15-1|15-3|15-2|120/208' str FROM dual UNION 
SELECT '15-1|15-3|15-2|120/208|STA-2' str FROM dual UNION 
SELECT '112-123|120/208|STA-3' FROM dual     
) tab