我有一个复合c1网站。我喜欢使用Microsoft Search Server功能。 我已经安装了所有软件,但是当我搜索时,我得到了每个页面,因为导航菜单在每个页面都被编入索引。当我在导航菜单上使用class =“noindex”选项时,爬虫不会跟踪菜单中使用的链接。
有人可以告诉我如何排除内容,但请确保抓取工具仍然遵循内容中使用的链接吗?
答案 0 :(得分:2)
考虑让站点地图页面包含您网站的导航结构,并在某个地方指向此页面的链接,然后可以使用抓取工具...然后在搜索“导航标题”中的某些关键字时,不要将所有网页都放在结果中将只有Sitemap页面。
答案 1 :(得分:1)
这基本上是Microsoft Search Server的一个问题,但是针对Composite C1的C1 Package试图解决这个问题。引自http://docs.composite.net/Composite.Search.MicrosoftSearchServer:
从索引中排除网页内容
确保在C1网站上的Web.config中指定了RemapperHttpModule。如果没有,请执行以下操作:
<httpModules>
和<modules>
下添加以下配置
(对于IIS 7.0或更高版本)元素:<add name="MssRemaper" type="Composite.Search.MicrosoftSearchServer.RemapperHttpModule" />
现在,要排除部分页面被Microsoft Search Server索引:
<div class="noindex">
确保抓取工具找到您的网页
排除导航元素将在Composite C1端进行,因此这样做会删除Search Server抓取工具跟踪这些链接的能力。您可以通过确保在您的网站上有站点地图并使Search Server索引站点地图页面的URL来解决此问题。