Initcap有一些限制

时间:2016-03-25 05:26:42

标签: regex oracle capitalization regexp-replace

我想将全名的每个首字母大写,但有一个例外:介词应该是小写的。

介词是:[“da”,“de”,“di”,“do”,“du”,“das”,“des”,“dis”,“dos”,“dus”]。< / p>

到目前为止,我有这个代码,但它太可怕了,不完整。如果我这样做(将我需要的所有例外)放在一边,那将是如此巨大。

DBMS_OUTPUT.PUT_LINE(
  REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE(REGEXP_REPLACE
    (INITCAP ('ronald DAS silva'), '(D|d)a', 'da'),
    '(D|d)o', 'do'), '(D|d)e', 'de'),'(D|d)o', 'do'),'(D|d)u', 'du'));

我已经尝试在REGEXP_REPLACE函数中使用^(d|D)[a-zA-Z]{1,2}$(使用此正则表达式 - &gt; INITCAP),但我没有成功。

那么,有没有办法让它更容易?

修改

我现在有这个:

DBMS_OUTPUT.PUT_LINE(REGEXP_REPLACE(INITCAP('ronald DAS silva'), '([d|D][[:alpha:]]{1,2})', LOWER('\1')));

它几乎正常工作,但LOWER函数由于某种原因没有完成他的工作,为什么?如果我把LOWER('A')设置为有效。

编辑2 - 其他测试:

每个以字母“d”开头的名称都将转换为小写,不应该发生。

然后有一些情况:

  • 丹尼尔
  • Deivid
  • 迪杰斯特拉
  • 唐纳德
  • 多棱

完整代码

DECLARE
  TYPE t_name IS VARRAY(3) OF VARCHAR2(100);
  v_names t_name := t_name('    Donald     dIs    siLvA',
                           'daniEl    da sIlvA XaVIeR   ',
                           '   DeYse De Olivier dA     loPeS');
BEGIN
  DBMS_OUTPUT.PUT_LINE(RPAD('Name w/o format', 60, ' ') ||
                            'Name formatted');
  DBMS_OUTPUT.PUT_LINE(RPAD('---------------------', 60, ' ') ||
                            '---------------------');

  FOR i IN 1..v_names.COUNT LOOP
    DBMS_OUTPUT.PUT_LINE(RPAD(v_names(i), 60, ' ') ||
                          f_format(v_names(i)));
  END LOOP;
END;

FUNCTION f_format(p_str VARCHAR2)
   RETURN VARCHAR2
AS
BEGIN
RETURN REGEXP_REPLACE(
         REGEXP_REPLACE(
           INITCAP(p_str),
         '((D)([aeiou](s|$)?))', 'd\3'),
       '[[:space:]]+', ' ');       
END;

1 个答案:

答案 0 :(得分:0)

我想我已经明白了。 Initcap整个字符串,然后查找由空格包围的模式(记住组1)。在其中,将它分开,因此第2组是主要的首都'D',第3组是其余的包括可选的's'。替换为空格,小写'd',记住组3和另一个空格。我不得不建议不要在生产中使用它,因为这对于这种名称格式来说太具体了。

SQL> declare
     name varchar2(20) := 'ronald dis silva';
   begin
     dbms_output.put_line(
       REGEXP_REPLACE(INITCAP(name), '( (D)([aeiou](s|$)?) )', ' d\3 '));
   end;
   /
Ronald dis Silva

SQL>

以'd'开头的名字对我有用:

SQL> declare
  2       name varchar2(20) := 'donald dis silva';
  3     begin
  4       dbms_output.put_line(
  5         REGEXP_REPLACE(INITCAP(name), '( (D)([aeiou](s|$)?) )', ' d\3 '));
  6     end;
  7  /
Donald dis Silva

使用WITH子句的一些更复杂名称的示例,以便更容易插入不同的名称进行测试:

SQL> with tbl(name) as (
      select '    Donald     dIs    siLvA'      from dual union
      select 'daniEl    da sIlvA XaVIeR   '     from dual union
      select '   DeYse De Olivier dA     loPeS' from dual
    )
    select REGEXP_REPLACE(INITCAP(REGEXP_REPLACE(trim(name), '\s+', ' ')), '( (D)([aeiou](s|$)?) )', ' d\3 ') newname
    from tbl;

NEWNAME
--------------------------------------------------------------------------------
Donald dis Silva
Deyse de Olivier da Lopes
Daniel da Silva Xavier

SQL>