SharePoint 2010搜索中的爬网程序影响规则和爬网规则之间有何区别?

时间:2011-02-12 21:56:06

标签: sharepoint search sharepoint-2010

SharePoint 2010搜索中的抓取工具影响规则和抓取规则之间有何区别?

1 个答案:

答案 0 :(得分:8)

爬网程序影响规则定义Windows SharePoint Services帮助搜索服务在爬网期间从网站请求文档的速率。速率可以定义为请求的同时文档数或请求之间的延迟。在没有爬虫影响规则的情况下,请求的文档数量从5到16,具体取决于硬件资源。

您可以使用抓取工具影响规则修改抓取时放置在网站上的负载。

爬网规则使您能够在要从特定路径爬网内容时设置企业搜索索引引擎的行为。通过使用这些规则,您可以:

  • 防止特定路径中的内容被抓取。

例如,在内容源指向http://www.microsoft.com/等网址路径的情况下,您希望阻止来自“downloads”子目录http://www.microsoft.com/downloads/的内容被抓取,为URL设置规则,行为设置为从该子目录中排除内容。

  • 表示应该抓取否则将从抓取中排除的特定路径。

使用上一个方案,如果downloads目录包含应该包含在爬网中的名为“content”的目录,则应为以下URL创建爬网规则,并将行为设置为包含“content”子目录{ {3}}