我有一个奇怪的问题,本周大部分都没有。
在我网站的页脚中,我使用随机链接使用java脚本
<a class="default.php">Some Default Text</a>
和javascript是
<script>
(function(){
var myLinks = [
{href: 'example.php?title=hello', text: 'example1'},
{href: 'example.php?title=hello2', text: 'example2'}
];
onload = function(){
var link, pageLinkClass = 'myLink', pageLinks = document.getElementsByTagName('a');
pageLinkClass = new RegExp('\\b' + pageLinkClass + '\\b');
for(var i = 0; i < pageLinks.length; ++i){
if(pageLinkClass.test(pageLinks[i].className)){
link = myLinks[Math.floor(Math.random() * myLinks.length)]
pageLinks[i].href = link.href;
pageLinks[i].firstChild.nodeValue = link.text;
pageLinks[i].target = '_self';
}
}
};
})();// JavaScript Document
</script>
(这是一个例子)
但是当我抓取我的网站以生成站点地图时,它只会将链接读取为example.php?title =
而不是尾随部分。
提前致谢
答案 0 :(得分:1)
您的抓取工具无法/不能解释JavaScript。很多机器人和爬虫只会阅读原始HTML。谷歌博特可以在某种程度上解释JS,但我仍然不会依赖它。最好的办法是生成链接服务器端。