未经Google编入索引的网页

时间:2011-04-04 11:09:17

标签: .net indexing

据我所知,我的公司在我们的网站上运行Google搜索索引所有网页。我开发了一个文档系统,也被谷歌索引。系统中的页面是动态生成的,因此我将www.mysite.com/doc.aspx?id=234,www.mysite.com/doc.aspx?id=236等编入索引。问题在于,某些随机页面(例如,www.mysite.com / doc.aspx?id = 235)由于某种未知原因而未编入索引。我希望在哪里解决这个问题?有什么想法吗?

4 个答案:

答案 0 :(得分:6)

这是一个关于谷歌如何处理您的网站的简短而简化的大纲

discovery -> crawling -> indexing -> ranking (->feedback)

<强>发现: 是谷歌发现你的网站页面的过程,这可以通过HTML中的链接或通过sitemap.xml(和页面上的网址javascript,RSS或原子提要,...基本上任何网址谷歌可以做到)找个地方)

<强>爬行: 谷歌抓取已发现网址内容的过程(并将新发现的网址推送到发现队列中)

<强>索引: 将已发现和已爬网的内容存储到其数据库中并使其可搜索

<强>居: 将索引内容与用户查询相匹配 - 如果足够重要 - 将其作为可见的SERP列表返回给用户。

<强>反馈 基于点击/不点击行为和从其他来源收集的数据(推测的ISDN数据和谷歌工具栏,Chrome浏览器报告,......)谷歌收集有关用户行为的反馈(及点击后)。

    每一步之间的
  • 都很多 质量指标(最后一步是 只是一个质量指标集合 工序)。
  • 每一步都报告回来 前面的步骤。

所以基本上即使您将所有网址都传达给谷歌(例如通过sitemap.xml),谷歌也不一定会抓取您的所有网址或索引或将其排名可见。

好的,那么低挂果实是什么让更多的页面进入索引(​​他们至少有机会对某些内容进行排名)?

  • 每页只传递一个URL(使用http 301重定向,规范标记并清理网络上的所有链接)
  • 让您的网站更快(影响巨大)
  • 让它更明智的KB(很好的影响,主要是因为它也更快)
  • 在您的网页上添加更多独特内容。
  • 防止重复内容
  • 外部(来自其他网站)链接到您的网页(不是总数很重要,但随着时间的推移会稳定增长)

p.s。:仅作为旁注 - 爬行步骤是可选的。甚至未被抓取的网址(即如果它们被robots.txt阻止)也可以被索引(和排名) - 但这不是很常见

答案 1 :(得分:0)

Afaik,如果页面未链接到其他页面,则不会对页面编制索引。也许没有一个页面链接到非索引页面?

答案 2 :(得分:0)

我同意丹尼尔。您需要一个包含链接列表的页面。或者是带有分页列表链接的页面。

但dinamyc网址对SEO不利,最好的方法是友好的网址。看看ISAPIRewrite或Routing。

我希望这对你有所帮助。

答案 3 :(得分:0)

并非所有页面都被编入索引,索引引擎只是认为某些页面是不间断的。在我们的网站上,大约80%的网页被编入索引,这被认为对于那种类型的网站非常有用,很少有网站具有更高的费率。

正如丹尼尔所说,拥有该页面的链接至关重要,否则将无法找到。然后页面必须有一些该页面唯一的信息,最好是一个唯一的标题,或者它可能被归类为副本。