如何将文本与变音符匹配?

时间:2018-08-31 08:26:02

标签: regex

我尝试在以下字符串中匹配文本“ Rasensamen undDünger”:

/rasensamen.html">Rasensamen und Dünger</a>

我这样尝试过:

>[\w+ ]+<\/a>

https://regex101.com/r/FolwpQ/1

但是不匹配,即使应该匹配。但是,如果我从ü中删除了Dünger,那么它有用吗?

1 个答案:

答案 0 :(得分:1)

许多正则表达式引擎提供了一个unicode选项,该选项在打开时与完整的unicode支持相匹配。在pcre风格中,这使\w[\p{L}\p{N}_]匹配,其中包括带有变音符号的拉丁字母。

在regex101.com中,只需单击标志左侧显示的选项即可添加u选项。

您可以将正则表达式简化为:

>[\w+ ]+<\/a>

Demo

请注意,如果有尖锐的s,则您在注释中建议的正则表达式>([\w+ äöü]+)<\/a>不起作用。