正则表达式获取属性值后面的另一个属性

时间:2012-09-19 15:04:22

标签: python html regex

在给定前面的文本的情况下,我试图获取属性的值。说我有这个:

<meta content="firsttag" name="datatoget" />

我想获得value名称(datatoget)  我知道特定属性(<meta ... name="

之前的内容

我如何使用正则表达式获取此值?

我得到了content="firstag" name=".*",它将返回我想要的内容,但周围的文字。基本上我想要`。*部分。

1 个答案:

答案 0 :(得分:0)

(?<=name=")[a-zA-Z0-9]*

(?<=name=")确保文字'name =“'落后于我们想要匹配的内容,而不会在结果中包含它。

[a-zA-Z0-9]限制捕获组,以便不包含最终引用。