据我所知,我的公司在我们的网站上运行Google搜索索引所有网页。我开发了一个文档系统,也被谷歌索引。系统中的页面是动态生成的,因此我将www.mysite.com/doc.aspx?id=234,www.mysite.com/doc.aspx?id=236等编入索引。问题在于,某些随机页面(例如,www.mysite.com / doc.aspx?id = 235)由于某种未知原因而未编入索引。我希望在哪里解决这个问题?有什么想法吗?
答案 0 :(得分:6)
这是一个关于谷歌如何处理您的网站的简短而简化的大纲
discovery -> crawling -> indexing -> ranking (->feedback)
<强>发现强>: 是谷歌发现你的网站页面的过程,这可以通过HTML中的链接或通过sitemap.xml(和页面上的网址javascript,RSS或原子提要,...基本上任何网址谷歌可以做到)找个地方)
<强>爬行强>: 谷歌抓取已发现网址内容的过程(并将新发现的网址推送到发现队列中)
<强>索引强>: 将已发现和已爬网的内容存储到其数据库中并使其可搜索
<强>居强>: 将索引内容与用户查询相匹配 - 如果足够重要 - 将其作为可见的SERP列表返回给用户。
<强>反馈强> 基于点击/不点击行为和从其他来源收集的数据(推测的ISDN数据和谷歌工具栏,Chrome浏览器报告,......)谷歌收集有关用户行为的反馈(及点击后)。
所以基本上即使您将所有网址都传达给谷歌(例如通过sitemap.xml),谷歌也不一定会抓取您的所有网址或索引或将其排名可见。
好的,那么低挂果实是什么让更多的页面进入索引(他们至少有机会对某些内容进行排名)?p.s。:仅作为旁注 - 爬行步骤是可选的。甚至未被抓取的网址(即如果它们被robots.txt阻止)也可以被索引(和排名) - 但这不是很常见
答案 1 :(得分:0)
Afaik,如果页面未链接到其他页面,则不会对页面编制索引。也许没有一个页面链接到非索引页面?
答案 2 :(得分:0)
我同意丹尼尔。您需要一个包含链接列表的页面。或者是带有分页列表链接的页面。
但dinamyc网址对SEO不利,最好的方法是友好的网址。看看ISAPIRewrite或Routing。
我希望这对你有所帮助。
答案 3 :(得分:0)
并非所有页面都被编入索引,索引引擎只是认为某些页面是不间断的。在我们的网站上,大约80%的网页被编入索引,这被认为对于那种类型的网站非常有用,很少有网站具有更高的费率。
正如丹尼尔所说,拥有该页面的链接至关重要,否则将无法找到。然后页面必须有一些该页面唯一的信息,最好是一个唯一的标题,或者它可能被归类为副本。