如何获取HTML和CSS中的所有链接

时间:2018-08-23 16:59:49

标签: html css parsing url

我在一个iframe中有一个HTML页面,该页面由用户提供。我想在此HTML页的任何位置都列出所有URL的列表。这包括CSS文件和样式属性中的链接。

例如,在以下代码上运行它:

<div>
    <style>
        ul {
            background: url("exampleImage.png") #00D no-repeat fixed;
        }
    </style>
    <ul style="list-style: square url(http://www.example.com/redball.png);">
        <li><a href="http://www.example.com/foobar">test</a></li>
    </ul>
</div>

应返回以下网址:

exampleImage.png
http://www.example.com/redball.png
http://www.example.com/foobar

1 个答案:

答案 0 :(得分:0)

听起来像是进行正则表达式的绝佳机会:

var re = /(https?:.*?)[\)"]/g
var s = document.body.innerHTML // here goes your html element
var m

do {
    m = re.exec(s);
    if (m) {
        console.log(m[1], m[2]);
    }
} while (m);

感谢lawnsea