如何获取<a href="http://www.mysite.com"> in JavaScript?</a>的网址

时间:2011-11-22 02:37:14

标签: regex node.js

我正在使用JavaScript处理一些文本(使用Node,所以请不要使用jQuery)。我想提取页面上<a>标签中的所有网址。我怎么能用JavaScript做到这一点?

1 个答案:

答案 0 :(得分:1)

var myArray = preg_match_all("<a.*?href=[\'|\"](.*?)[\'|\"]", "How can I get the URL of an <a href=\"http://www.mysite.com\"> in JavaScript? How can I get the URL of an <a href=\"http://www.mysite.org\"> in JavaScript?")

if ( myArray != null) {
  for ( i = 0; i < myArray.length; i++ ) { 
    alert(myArray[i]);
  }
}

function preg_match_all(regex, haystack) {
   var globalRegex = new RegExp(regex, 'g');
   var globalMatch = haystack.match(globalRegex);
   matchArray = new Array();
   for (var i in globalMatch) {
      nonGlobalRegex = new RegExp(regex);
      nonGlobalMatch = globalMatch[i].match(nonGlobalRegex);
      matchArray.push(nonGlobalMatch[1]);
   }
   return matchArray;
}

preg_match_all函数取自http://coding.pressbin.com/16/Javascript-equivalent-of-PHPs-pregmatchall

我建议使用这样的在线测试器:http://www.pagecolumn.com/tool/regtest.htm