清单：

<ul id="list-id">
    <li><a href="match this">match this too</a></li>
    <li><a href="match this">match this too</a></li>
    <li><a href="match this">match this too</a></li>
</ul>

这是我得到的正则表达式，只匹配最后一个链接：

/<ul id=['"]list-id['"]>\s*(?:<li><a href=['"]([^'"]+)['"]>([^<]+)<\/a><\/li>\s*)*<\/ul>/i

Regex101

Answer 1

您可以捕获网址和名称，可以重复使用$ 1，$ 2 ...

https://regex101.com/r/zW0jR1/4

新版正则表达式.+href="(.+)">(.+)<

Answer 2

您可以使用此/<li><a href="(.*)">(.*)<\/a><\/li>/

然后您可以运行scan方法。

string = '<ul id="list-id">
           <li><a href="match this">match this too</a></li>
           <li><a href="match this">match this too</a></li>
           <li><a href="match this">match this too</a></li>
         </ul>'

string.scan(/<li><a href="(.*)">(.*)<\/a><\/li>/)

这会返回一个二维数组

[["match this", "match this too"], 
 ["match this", "match this too"], 
 ["match this", "match this too"]]

正则表达式匹配链接文本＆amp;列表中的网址

清单：

2 个答案: