我正在尝试匹配Python中的正则表达式。
我希望匹配\u01234string
或string\u01234string
或string\u01234
等字符串。
我的解决方案是\\u\d+\D+(,|\s|\D+)
。
点击https://regex101.com/r/gmWALn/1查看我的表情和示例文字。
问题:无论我尝试什么,比赛都拒绝结束。如果我添加$
,那么它将无法匹配任何内容。
在此示例中,\u0130stanbul
和Regi\u00f3n
。
答案 0 :(得分:0)
如果你的字符串总是会像上面所示那样有一个unicode char,那么这个正则表达式就可以了:
icon2.*\n.*\n.*>\s*([\s\S]+?)\s*(?=<\/td>)
在此成功测试:http://pythex.org/
答案 1 :(得分:0)
\u00f3
不是字面斜杠,&#34; u&#34;和十六进制字符。它只是unicode字符U + 00F3 ó
的表示(带有急性的拉丁语小写字母O)。
因此,如果您想匹配它,请使用模式:ur'ó'