Stack溢出如何使搜索引擎可以看到他们的问题

时间:2012-01-28 19:57:00

标签: search-engine web-crawler

搜索引擎如何抓取stackoverflow或quora或任何其他论坛中发布的问题,并在search结果中显示这些问题。希望链接有效

这可能类似于Facebook在搜索引擎中的user profile visibility

这些网站是否会定期更新其网站地图?

用例:尝试构建本地事件收集网站。动态发布的事件应该对搜索引擎可见,以便抓取并显示在搜索结果中。

一些好的&有效参考了解这种用例的站点地图的概念确实会有所帮助。

1 个答案:

答案 0 :(得分:1)

基本搜索引擎优化,

Pretty-urls(/ questions / 32728 / slug)的组合,格式良好的HTML,易于解析的标题和规范信息允许谷歌和其他搜索引擎只需通过以下链接即可抓取到网站的尽可能多的角落。

谷歌本身并没有实时做任何事情,也没有任何搜索引擎。定期谷歌发送他们的抓取机器人来收集有关网站的新信息或更新信息,如果网站所有者连接网站管理员工具(在这种情况下来自Google),这也是您的网站连接到Google网站管理员工具也有助于提高可见性和可用性的地方在他们的网站上,他们不仅打开了报告功能的大门,而且还引发了googlebot更高的抓取优先级。网站管理员工具的内部是选项和设置,可帮助googlebot了解在何处查找内容以及如何在结果中显示列表,以及如何解决这些列表中的链接。

通过定期,我的意思是几天,一周,有时长达一个月。如果您现在发布一个问题,它就不会轻易地在谷歌上出现一周左右。谷歌还提出了基于查询本身的内容与页面内容显示的链接的优先级(标题和正文内容一起构成了最重要的谷歌,metakeys和描述现在是三级和较低的优先级。例如你不能有一个题为“如何制作美食”的标题,并提供有关PHP配置的内容。如果您已登录,Google也会根据您的搜索记录确定结果的优先级,如果您未登录,也会根据该IP地址的搜索历史记录

站点地图也非常有助于难以从首页抓取的网站。请注意Faccebook如何要求您先登录。 Googlebot没有帐户,也没有任何内容可以随处获取。站点地图允许googlebot确定网站上的哪个位置可以开始抓取。否则facebook只会有1个可见的结果。

要查看网站在可搜索网页方面的效果,请将“网站:”放在谷歌前面的网址中,然后您会看到谷歌有关该网站的所有可用结果(并且会提供估算结果)结果的数量,如果有很多)

站点:www.google.com 和 网站:google.com

www的可见性和/或要求。也是一个重要的区别。