我只需要在href中提取一次部分。但是,我还需要指定它必须只匹配以下文本为的{hrefs:Launch Information Processing Workflow
,
<a class="wcmListViewLink" target="_blank" href="getContent?objectStoreName=Nice&vsId=%7BE6B85994-9B93-4A3C-878A-C7BBBA39BAD8%7D&objectType=document&folderId=%7BB51627F8-D74C-4607-ADD7-AC9C125D67F9%7D">Launch Information Processing Workflow</a>
以下的工作:
href="(.+?)%7D"
如何使其更具体,并需要Launch Information Processing Workflow
文字片段?
答案 0 :(得分:2)
您忘记添加.*
以匹配"
和>Launch
之间的任何字符。
( E.g :href="link" class="btn">Launch
)
这个应该有效:
/href="(.+?)\".*?>Launch/
您可以在此处查看:https://regex101.com/r/rN0tI5/2
答案 1 :(得分:0)
It is not very recommended to parse HTML using regular expressions,请考虑使用XPath Extractor配置如下:
//a[text()='Launch Information Processing Workflow']/@href
Use Tidy
框