如果我去这个网址 http://sppp.rajasthan.gov.in/robots.txt
我得到了
User-Agent: *
Disallow:
Allow: /
这意味着允许抓取工具完全访问网站并将所有内容编入索引,然后为什么网站搜索:sppp.rajasthan.gov.in在谷歌搜索中只显示几页,其中包含大量文档,包括pdf文件。< / p>
答案 0 :(得分:3)
可能有很多原因。
Disallow
行:
此外,您可能没有记录中的空白行,因为它们用于分隔多个记录。
仔细观察它。
onclick
javascript并且它不会更改网址,因此即使谷歌想要,也无法链接到第2页。我的原始观点仍然存在。 Google应该能够找到http://sppp.rajasthan.gov.in/sppp/upload/documents/5_GFAR.pdf页面上的http://sppp.rajasthan.gov.in/actrulesprocedures.php。如果您对特定页面可能缺失的原因有疑问,我会尝试回答。
但基本上网站做了一些奇怪的非标准事情,这正是你需要一个站点地图。与流行的观点相反,站点地图对于搜索引擎优化是不,这是因为Google无法找到您的网页。