我有这个表达
<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>; Ilustração: <a id="productPageRightSectionTop-entidade-lnk">João Caetano</a> </h3>
我做了这个
<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">(.+)</a>
但是得到了所有东西,我只想要这个部分
<a id="productPageRightSectionTop-author-lnk" data-id="2316">José Saramago</a>
你知道我怎么能这样做吗?
答案 0 :(得分:0)
问题出现在正则表达式的末尾:
(.+)
data-id="[0-9]+">[^<]*</a>
过于贪婪,事后与之匹敌。
将该部分更改为:
<h3 id="productPageRightSectionTop-authors-h3">de <a id="productPageRightSectionTop-author-lnk" data-id="[0-9]+">[^<]*</a>
应该修复选择。选择器应如下所示:
{{1}}