Google抓取工具存储了哪些信息?

时间:2010-09-11 10:26:38

标签: web web-crawler information-retrieval

..以及网络抓取工具如何推断网站上信息的语义? 在单独的答案中列出排名信号。

3 个答案:

答案 0 :(得分:1)

来自http://www.google.com/corporate/tech.html

超文本匹配分析:我们的搜索引擎还会分析网页内容。但是,我们的技术不是简单地扫描基于页面的文本(可以通过元标记由网站发布者操纵),而是分析页面的完整内容以及字体,细分和每个单词的精确位置的因素。我们还分析相邻网页的内容,以确保返回的结果与用户的查询最相关。

除此之外,你的猜测和我的一样好。

答案 1 :(得分:1)

  • 作为排名信号的语义接近度

  • 网站流量,#visitor,趋势

排名因素 - http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm

答案 2 :(得分:0)

我想没有人真的知道,这是商业秘密:)