GSA没有关注链接

时间:2015-02-26 09:00:50

标签: google-search-appliance

我们的GSA索引了多个网站。对于网站abc.com,一切都很完美。起始网址是主页,GSA正确地跟踪了该网站的链接,并对整个网站编制索引。

对于网站def.com,设置相同(起始网址,跟随模式),并且链接有效。主页被索引,但没有遵循那里的链接。但是如果我通过重新抓取它直接索引链接页面,它就会被添加。许可证限制不是问题 - 已爬网文档的数量远低于限制。我还确保不会跳过页面,因为"不遵循模式"。该网站没有robots.txt文件,因此也没有排除。没有noindex / nofollow / googleon / googleoff标签。

那么为什么GSA无法关注链接?

2 个答案:

答案 0 :(得分:0)

这取决于def.com如何呈现内容。如果链接是在浏览器端的站点def.com的运行时构建的,那么GSA将无法复制它以理解页面上的链接。

答案 1 :(得分:0)

点击浏览器上的def.com主页,查找锚标记。<a href= />。 如果它存在,显然GSA将遵循网址和索引相同。 您还可以检查def.com主页的爬网诊断(Number of links on this page to crawled pages),以了解GSA是否能够从您的主页发现链接。

如果GSA没有从主页发现链接,那么请继续为def.com网站创建跳转页面,并使用noindex robots元标记进行索引。

希望它有所帮助。