我正在寻找一种方法来搜索网页的源代码,以获取网址格式的所有字符串并将它们放入数组中。我可以使用Firebug的控制台或类似的东西在任何页面上执行的东西。我不知道该怎么做。我尝试的所有东西都返回NULL。感谢。
答案 0 :(得分:3)
类似的东西:
document.body.innerHTML.match(/https?:\/\/[^'">\s]+/g);
答案 1 :(得分:0)
试试这个:
var anchor_tags = document.getElementsByTagName("a");
var urls = [];
for(var i=0;i<anchor_tags.length;i++){
urls.push(anchor_tags[i].href);
}
console.log(ursl);
答案 2 :(得分:0)
对于html中的所有网址:
(function(){
var allURLs = document.head.innerHTML.match(/https?:\/\/[^'">\s]+/g).join()
+ document.body.innerHTML.match(/https?:\/\/[^'">\s]+/g).join();
console.log(allURLs);
})()