google-search-appliance - GSA没有关注链接

GSA没有关注链接

时间：2015-02-26 09:00:50

标签： google-search-appliance

我们的GSA索引了多个网站。对于网站abc.com，一切都很完美。起始网址是主页，GSA正确地跟踪了该网站的链接，并对整个网站编制索引。

对于网站def.com，设置相同（起始网址，跟随模式），并且链接有效。主页被索引，但没有遵循那里的链接。但是如果我通过重新抓取它直接索引链接页面，它就会被添加。许可证限制不是问题 - 已爬网文档的数量远低于限制。我还确保不会跳过页面，因为＆＃34;不遵循模式＆＃34;。该网站没有robots.txt文件，因此也没有排除。没有noindex / nofollow / googleon / googleoff标签。

那么为什么GSA无法关注链接？

2 个答案:

答案 0 :(得分：0)

这取决于def.com如何呈现内容。如果链接是在浏览器端的站点def.com的运行时构建的，那么GSA将无法复制它以理解页面上的链接。

答案 1 :(得分：0)

点击浏览器上的def.com主页，查找锚标记。<a href= />。如果它存在，显然GSA将遵循网址和索引相同。您还可以检查def.com主页的爬网诊断（Number of links on this page to crawled pages），以了解GSA是否能够从您的主页发现链接。

如果GSA没有从主页发现链接，那么请继续为def.com网站创建跳转页面，并使用noindex robots元标记进行索引。

希望它有所帮助。