优化/自定义Sharepoint搜索爬网

时间:2008-08-29 20:19:32

标签: c# .net sharepoint

使用 SharePoint Server 2007 ,还有搜索功能和抓取工具。但是,Crawler在某种程度上受到限制,因为它只在抓取外部网站时支持Basic Auth,并且无法告诉它忽略无索引,无跟随属性。

现在,有一个网站我想索引,不幸的是这个网站使用它自己的身份验证系统,并且它在页面上使用无索引,无跟随。当我控制该站点时,我可以删除属性,但这是一个PITA。此外,它无法解决身份验证问题。

所以我只是想知道是否有可能以某种方式扩展Sharepoint的Crawler?

1 个答案:

答案 0 :(得分:3)

MOSS SP1中已经解决了具有不同表单身份验证的MOSS爬网站点的限制。 :

http://www.microsoft.com/downloads/details.aspx?FamilyID=ad59175c-ad6a-4027-8c2f-db25322f791b&displaylang=en

这是一篇帖子的链接,该帖子描述了如何获取SP1之前的MOSS修补程序,以便通过表单身份验证来抓取网站:

http://blogs.microsoft.co.il/blogs/adir_ron/archive/2007/10/11/moss-search-for-sso-form-based-authentication-sites.aspx

希望有所帮助!