Question

据我所知，我的公司在我们的网站上运行Google搜索索引所有网页。我开发了一个文档系统，也被谷歌索引。系统中的页面是动态生成的，因此我将www.mysite.com/doc.aspx?id=234,www.mysite.com/doc.aspx?id=236等编入索引。问题在于，某些随机页面（例如，www.mysite.com / doc.aspx？id = 235）由于某种未知原因而未编入索引。我希望在哪里解决这个问题？有什么想法吗？

Answer 1

这是一个关于谷歌如何处理您的网站的简短而简化的大纲

discovery -> crawling -> indexing -> ranking (->feedback)

<强>发现：是谷歌发现你的网站页面的过程，这可以通过HTML中的链接或通过sitemap.xml（和页面上的网址javascript，RSS或原子提要，...基本上任何网址谷歌可以做到）找个地方）

<强>爬行：谷歌抓取已发现网址内容的过程（并将新发现的网址推送到发现队列中）

<强>索引：将已发现和已爬网的内容存储到其数据库中并使其可搜索

<强>居：将索引内容与用户查询相匹配 - 如果足够重要 - 将其作为可见的SERP列表返回给用户。

<强>反馈基于点击/不点击行为和从其他来源收集的数据（推测的ISDN数据和谷歌工具栏，Chrome浏览器报告，......）谷歌收集有关用户行为的反馈（及点击后）。

都很多质量指标（最后一步是只是一个质量指标集合工序）。
每一步都报告回来前面的步骤。

所以基本上即使您将所有网址都传达给谷歌（例如通过sitemap.xml），谷歌也不一定会抓取您的所有网址或索引或将其排名可见。

好的，那么低挂果实是什么让更多的页面进入索引（他们至少有机会对某些内容进行排名）？

每页只传递一个URL（使用http 301重定向，规范标记并清理网络上的所有链接）
让您的网站更快（影响巨大）
让它更明智的KB（很好的影响，主要是因为它也更快）
在您的网页上添加更多独特内容。
防止重复内容
外部（来自其他网站）链接到您的网页（不是总数很重要，但随着时间的推移会稳定增长）

p.s。：仅作为旁注 - 爬行步骤是可选的。甚至未被抓取的网址（即如果它们被robots.txt阻止）也可以被索引（和排名） - 但这不是很常见

Answer 2

Afaik，如果页面未链接到其他页面，则不会对页面编制索引。也许没有一个页面链接到非索引页面？

Answer 3

我同意丹尼尔。您需要一个包含链接列表的页面。或者是带有分页列表链接的页面。

但dinamyc网址对SEO不利，最好的方法是友好的网址。看看ISAPIRewrite或Routing。

我希望这对你有所帮助。

Answer 4

并非所有页面都被编入索引，索引引擎只是认为某些页面是不间断的。在我们的网站上，大约80％的网页被编入索引，这被认为对于那种类型的网站非常有用，很少有网站具有更高的费率。

正如丹尼尔所说，拥有该页面的链接至关重要，否则将无法找到。然后页面必须有一些该页面唯一的信息，最好是一个唯一的标题，或者它可能被归类为副本。

未经Google编入索引的网页

4 个答案: