如何获得正则表达式

时间:2016-05-15 09:52:56

标签: regex matcher

我有这个表达

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>; Ilustração:  <a id="productPageRightSectionTop-entidade-lnk">João Caetano</a>&nbsp;</h3>

我做了这个

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">(.+)</a>

但是得到了所有东西,我只想要这个部分

<a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>

你知道我怎么能这样做吗?

1 个答案:

答案 0 :(得分:0)

问题出现在正则表达式的末尾:

(.+)

data-id="[0-9]+">[^<]*</a>过于贪婪,事后与之匹敌。 将该部分更改为:

<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">[^<]*</a>

应该修复选择。选择器应如下所示:

{{1}}