我尝试在以下字符串中匹配文本“ Rasensamen undDünger”:
/rasensamen.html">Rasensamen und Dünger</a>
我这样尝试过:
>[\w+ ]+<\/a>
https://regex101.com/r/FolwpQ/1
但是不匹配,即使应该匹配。但是,如果我从ü
中删除了Dünger
,那么它有用吗?
答案 0 :(得分:1)
许多正则表达式引擎提供了一个unicode选项,该选项在打开时与完整的unicode支持相匹配。在pcre风格中,这使\w
与[\p{L}\p{N}_]
匹配,其中包括带有变音符号的拉丁字母。
在regex101.com中,只需单击标志左侧显示的选项即可添加u
选项。
您可以将正则表达式简化为:
>[\w+ ]+<\/a>
请注意,如果有尖锐的s,则您在注释中建议的正则表达式>([\w+ äöü]+)<\/a>
不起作用。