使用python中的regex从HTML中提取内容

时间:2016-04-11 03:27:36

标签: python html regex

我有这个HTML代码

this.setState(data)

这是一种刺痛,我想在 data-reveal 前面提取内容。 我做了一些正则表达式

<a class="button block left icon-phone" data-reveal="\u06f0\u06f9\u06f3\u06f6\u06f5\u06f6\u06f8\u06f1\u06f6\u06f2\u06f1"  href="#">

但他们没有用。我该怎么做 ? 感谢。

1 个答案:

答案 0 :(得分:2)

你不应该使用正则表达式,但我会假设你想要,因为那是你在op中所做的。我不确定你想要什么,所以这里是如何做我认为你可以问的任何一个

match everything in data-reveal:
data-reveal="(.+?)"
matches: \u06f0\u06f9\u06f3\u06f6\u06f5\u06f6\u06f8\u06f1\u06f6\u06f2\u06f1

match EVERYTHING in front of data-reveal
data-reveal="(.+)
matches: \u06f0\u06f9\u06f3\u06f6\u06f5\u06f6\u06f8\u06f1\u06f6\u06f2\u06f1"  href="#">

第一个正则表达式:https://regex101.com/r/jW9fT4/1

第二个正则表达式:https://regex101.com/r/uZ7vX2/1