获取文本之间的URL

时间:2015-12-09 07:37:25

标签: regex

我想从下面给出的文字中获取网址

<a href="/film/3022900-12-years-a-slave" class="item-link"> 所需数据为/film/3022900-12-years-a-slave只需href="之后和"

之间的数据

我正在使用

"\w+

1 个答案:

答案 0 :(得分:1)

如果这是唯一的文本,并且没有其他html,那么您可以使用以下正则表达式:

href="([^"]+)

或者您也可以根据自己的情况使用lookbehind

(?<=href=")([^"]+)

但如果它是大型html文件的一部分,那么你应该使用任何DOM或类似的解析器(可能)。