我正在使用JavaScript处理一些文本(使用Node,所以请不要使用jQuery)。我想提取页面上<a>
标签中的所有网址。我怎么能用JavaScript做到这一点?
答案 0 :(得分:1)
var myArray = preg_match_all("<a.*?href=[\'|\"](.*?)[\'|\"]", "How can I get the URL of an <a href=\"http://www.mysite.com\"> in JavaScript? How can I get the URL of an <a href=\"http://www.mysite.org\"> in JavaScript?")
if ( myArray != null) {
for ( i = 0; i < myArray.length; i++ ) {
alert(myArray[i]);
}
}
function preg_match_all(regex, haystack) {
var globalRegex = new RegExp(regex, 'g');
var globalMatch = haystack.match(globalRegex);
matchArray = new Array();
for (var i in globalMatch) {
nonGlobalRegex = new RegExp(regex);
nonGlobalMatch = globalMatch[i].match(nonGlobalRegex);
matchArray.push(nonGlobalMatch[1]);
}
return matchArray;
}
preg_match_all函数取自http://coding.pressbin.com/16/Javascript-equivalent-of-PHPs-pregmatchall
我建议使用这样的在线测试器:http://www.pagecolumn.com/tool/regtest.htm