Question

我有一个奇怪的问题，本周大部分都没有。

在我网站的页脚中，我使用随机链接使用java脚本

 <a class="default.php">Some Default Text</a>

和javascript是

 <script>
 (function(){
  var myLinks = [
{href: 'example.php?title=hello', text: 'example1'},
{href: 'example.php?title=hello2', text: 'example2'}
];
onload = function(){
var link, pageLinkClass = 'myLink', pageLinks = document.getElementsByTagName('a');
pageLinkClass = new RegExp('\\b' + pageLinkClass + '\\b');
for(var i = 0; i < pageLinks.length; ++i){
if(pageLinkClass.test(pageLinks[i].className)){
link = myLinks[Math.floor(Math.random() * myLinks.length)]
pageLinks[i].href = link.href;
pageLinks[i].firstChild.nodeValue = link.text;
pageLinks[i].target = '_self';
}
}
};
})();// JavaScript Document
</script>

（这是一个例子）

但是当我抓取我的网站以生成站点地图时，它只会将链接读取为example.php？title =

而不是尾随部分。

提前致谢

Answer 1

您的抓取工具无法/不能解释JavaScript。很多机器人和爬虫只会阅读原始HTML。谷歌博特可以在某种程度上解释JS，但我仍然不会依赖它。最好的办法是生成链接服务器端。

网站地图没有阅读JavaScript链接

1 个答案: