从文档文本(内容)

时间:2016-01-12 03:34:45

标签: javascript jquery seo

我正在开发工具来检查所有类型资源的状态,例如js,css,img等以及给定网站的其他网址。

例如给出网址:www.abc.com 然后我需要检查所有类型的资源和URL的状态www.abc.com

为此,我使用jquery ajax ...结果,我将获得该网址的html内容(abc.com)

但问题是如何从该HTML内容中找到所有网址?我尝试了很多方法,但无法弄清楚我该怎么做。

请为此提供一些好的解决方案。

提前致谢。

3 个答案:

答案 0 :(得分:2)

尝试使用.each()来迭代imglinkscript元素;检索srchref属性值

$("img, link, script").each(function() {
  // do stuff with `this.src` or `this.href`
  console.log(this.src || this.href)
})

答案 1 :(得分:2)

  $('a, img, link, script').each(function () {
        console.info($(this).attr('href'));
        console.info($(this).attr('src'));
    });

答案 2 :(得分:1)

如果您想使用纯JavaScript获取所有“网址”。

<强> HTML:

<a href="www.google.com">1</a>
<br>
<a href="www.facebook.com">2</a>
<br>
<a href="www.yahoo.com">3</a>
<br>
<a href="www.bing.com">4</a>
<br>
<a href="www.youtube.com">5</a>
<br>
<a href="www.iRanOutOfNames.com">6</a>
<br>

<强> JavaScript的:

function getURLs(url) {
  //create an empty array
  var array = [];
  // get all <a> tags
  //note: you can do that with <img/> tags or any
  //I only used the <a> tag for the sake of time
  url = document.getElementsByTagName("a");
  //loop through all of the elements
  for (var i = 0; i < url.length; i++) {
    //when done, add all the elements inside the empty array
    array.push(url[i].href);
  }
  //alert them
  alert(array);
}
//call the function
getURLs();

演示:jsfiddle