我想要一个正则表达式来获取双引号之间的任何URL。
<a href="http://www.any-web_address.com">
<a href="http://142.12.64.71:8083">
答案 0 :(得分:0)
"http://[0-9 a-z A-Z . : ]{1,100}"
答案 1 :(得分:0)
这样的东西?
\"\K([\w\:\/\.\-]+)
如果你想要双引号(据说&#34;在双引号和#34之间取任何网址;所以我想没有\&#34;):
\"([\w\:\/\.\-]+)\"
答案 2 :(得分:0)
这是我的建议(如果你的正则表达式支持外观):
(?<=href="|link="|src=")(((http|https)(:\/\/))?([\/\w\-]{2,})(([\.])([\w\-]*)){1,})([\w.,@?^=%&:\/~+#-]*[\w@?^=%&\/~+#-]*)(?=")
答案 3 :(得分:0)
如果您不减少问题的范围,这篇帖子:Why it's not possible to use regex to parse HTML/XML: a formal explanation in layman's terms可能会对您有所帮助。否则,例如,如果您只想要href=
之后的URI,您可以这样做:
/(?:href=")(.[^"]*)"/g
答案 4 :(得分:0)