使用空格和字符将字符串拆分为Oracle中的分隔符和regexp_substr

时间:2015-07-27 13:28:21

标签: sql regex oracle string-split regexp-substr

我试图用regexp_subtr分割字符串,但我无法使其正常工作。

所以,首先,我有这个查询

select regexp_substr('Helloworld - test!' ,'[[:space:]]-[[:space:]]') from dual

非常好地提取我的分隔符 - 空白 - 空白

但是,当我尝试使用此选项拆分字符串时,它只是不起作用。

select regexp_substr('Helloworld - test!' ,'[^[[:space:]]-[[:space:]]]+')from dual

查询不返回任何内容。

非常感谢帮助! 感谢

5 个答案:

答案 0 :(得分:8)

SQL Fiddle

Oracle 11g R2架构设置

CREATE TABLE TEST( str ) AS
          SELECT 'Hello world - test-test! - test' FROM DUAL
UNION ALL SELECT 'Hello world2 - test2 - test-test2' FROM DUAL;

查询1

SELECT Str,
       COLUMN_VALUE AS Occurrence,
       REGEXP_SUBSTR( str ,'(.*?)([[:space:]]-[[:space:]]|$)', 1, COLUMN_VALUE, NULL, 1 ) AS split_value
FROM   TEST,
       TABLE(
         CAST(
           MULTISET(
             SELECT LEVEL
             FROM   DUAL
             CONNECT BY LEVEL < REGEXP_COUNT( str ,'(.*?)([[:space:]]-[[:space:]]|$)' )
           )
           AS SYS.ODCINUMBERLIST
         )
       )

<强> Results

|                               STR | OCCURRENCE |  SPLIT_VALUE |
|-----------------------------------|------------|--------------|
|   Hello world - test-test! - test |          1 |  Hello world |
|   Hello world - test-test! - test |          2 |   test-test! |
|   Hello world - test-test! - test |          3 |         test |
| Hello world2 - test2 - test-test2 |          1 | Hello world2 |
| Hello world2 - test2 - test-test2 |          2 |        test2 |
| Hello world2 - test2 - test-test2 |          3 |   test-test2 |

答案 1 :(得分:1)

如果我理解正确,这将对您有所帮助。目前您的输出为Helloworld(末尾有空格)。所以我假设你不想在最后有空间。如果是这样,你可以简单地使用分隔符中的空格。

select regexp_substr('Helloworld - test!' ,'[^ - ]+',1,1)from dual;

OUTPUT
Helloworld(No space at the end)

正如您在评论中提到的,如果您想要使用Helloworldtest!输出两列。你可以做到以下几点。

select regexp_substr('Helloworld - test!' ,'[^ - ]+',1,1),
       regexp_substr('Helloworld - test!' ,'[^ - ]+',1,3) from dual;

OUTPUT
col1         col2
Helloworld   test!

答案 2 :(得分:1)

尝试通过将匹配字符串'[[:space:]]-[[:space:]]'置于带有抑扬符(^)的字符类中来否定匹配字符串[^[[:space:]]将无效。一对方括号之间的所有内容都被视为可选单个字符的列表,除了命名的命名字符类,它扩展到可选字符列表,但是,由于字符类嵌套的方式,你的外括号很可能是解释如下:

  • -单个非空格非左方括号字符
  • [[:space:]]后跟一个连字符
  • ]+后跟一个空格字符
  • select regexp_substr(regexp_replace('Helloworld - test!' ,'[[:space:]]-[[:space:]]' ,chr(11)) ,'([^'||chr(11)||']*)('||chr(11)||'|$)' ,1 -- Start here ,2 -- return 1st, 2nd, 3rd, etc. match ,null ,1 -- return 1st sub exp ) from dual; 后跟一个或多个右方括号。

使用regexp_replace将多字符分隔符转换为单个字符可能更容易,然后使用regex_substr查找单个部分:

-

在此代码中,我首先将chr(11)更改为<StackPanel> <Label Content="{Binding ID, Source={StaticResource emp2}}"></Label> <Label Content="{Binding Name, Source={StaticResource emp2}}"></Label> </StackPanel> 。这是ASCII垂直制表符(VT)字符,不太可能出现在大多数文本字符串中。然后regexp_substr的匹配表达式匹配所有非VT字符,后跟VT字符或行尾。仅返回非VT字符(第一个子表达式)。

答案 3 :(得分:0)

MT0答案略有改善。使用regexp_count进行动态计数并证明它处理空值,其中[^ delimiter] +的格式作为模式不处理NULL列表元素。有关详细信息,请访问:Split comma seperated values to columns

SQL> with tbl(str) as (
  2    select ' - Hello world - test-test! -  - test - ' from dual
  3  )
  4  SELECT LEVEL AS Occurrence,
  5         REGEXP_SUBSTR( str ,'(.*?)([[:space:]]-[[:space:]]|$)', 1, LEVEL, NULL, 1 ) AS split_value
  6  FROM   tbl
  7  CONNECT BY LEVEL <= regexp_count(str, '[[:space:]]-[[:space:]]')+1;

OCCURRENCE SPLIT_VALUE
---------- ----------------------------------------
         1
         2 Hello world
         3 test-test!
         4
         5 test
         6

6 rows selected.

SQL>

答案 4 :(得分:0)

CREATE OR REPLACE FUNCTION field(i_string            VARCHAR2
                                ,i_delimiter         VARCHAR2
                                ,i_occurance         NUMBER
                                ,i_return_number     NUMBER DEFAULT 0
                                ,i_replace_delimiter VARCHAR2) RETURN VARCHAR2     IS
  -----------------------------------------------------------------------
  -- Function Name.......: FIELD
  -- Author..............: Dan Simson
  -- Date................: 05/06/2016 
  -- Description.........: This function is similar to the one I used from 
  --                       long ago by Prime Computer.  You can easily
  --                       parse a delimited string.
  -- Example.............: 
  --  String.............: This is a cool function
  --  Delimiter..........: ' '
  --  Occurance..........: 2
  --  Return Number......: 3
  --  Replace Delimiter..: '/'
  --  Return Value.......: is/a/cool
  --------------------------------------------------------------------------    ---                                    
  v_return_string  VARCHAR2(32767);
  n_start          NUMBER := i_occurance;
  v_delimiter      VARCHAR2(1);
  n_return_number  NUMBER := i_return_number;
  n_max_delimiters NUMBER := regexp_count(i_string, i_delimiter);
BEGIN
  IF i_return_number > n_max_delimiters THEN
    n_return_number := n_max_delimiters + 1;
  END IF;
  FOR a IN 1 .. n_return_number LOOP
    v_return_string := v_return_string || v_delimiter || regexp_substr    (i_string, '[^' || i_delimiter || ']+', 1, n_start);
    n_start         := n_start + 1;
    v_delimiter     := nvl(i_replace_delimiter, i_delimiter);
  END LOOP;
  RETURN(v_return_string);
END field;


SELECT field('This is a cool function',' ',2,3,'/') FROM dual;

SELECT regexp_substr('This is a cool function', '[^ ]+', 1, 1) Word1
      ,regexp_substr('This is a cool function', '[^ ]+', 1, 2) Word2
      ,regexp_substr('This is a cool function', '[^ ]+', 1, 3) Word3
      ,regexp_substr('This is a cool function', '[^ ]+', 1, 4) Word4
      ,regexp_substr('This is a cool function', '[^ ]+', 1, 5) Word5
  FROM dual;