带有北欧字符的非标题套管的正则表达式(ÆØÅæøå)

时间:2015-02-23 16:51:05

标签: regex character-encoding

我遇到了一些与所有非title-case字符串匹配的正则表达式的问题。问题是它匹配包含北欧字符ÆØÅæøå的所有句子(至少当我通过https://www.regex101.com/运行时)。

\b([ÆØÅA-Z])([ÆØÅA-Z][ÆØÅA-Zæøåa-z]*)|\b([æøåa-z])([æøåa-zÆØÅA-Z]+)

它应匹配以下字符串:

"RØDOVRE"

它不应匹配如下字符串:

"Rødovre"

1 个答案:

答案 0 :(得分:1)

你可以使用这个表达式:

(?:(?<=\s)|^)([ÆØÅA-Z]+)(?:(?=\s)|$)

这是Demo