标签: regex character-encoding
我遇到了一些与所有非title-case字符串匹配的正则表达式的问题。问题是它匹配包含北欧字符ÆØÅæøå的所有句子(至少当我通过https://www.regex101.com/运行时)。
\b([ÆØÅA-Z])([ÆØÅA-Z][ÆØÅA-Zæøåa-z]*)|\b([æøåa-z])([æøåa-zÆØÅA-Z]+)
它应匹配以下字符串:
"RØDOVRE"
它不应匹配如下字符串:
"Rødovre"
答案 0 :(得分:1)
你可以使用这个表达式:
(?:(?<=\s)|^)([ÆØÅA-Z]+)(?:(?=\s)|$)
这是Demo