我正在使用基于SharePoint Server 2007 Enterprise和Windows Server 2008 Enterprise的Microsoft Search Server 2008。我想知道是否有任何方法(一些开放的API或Web服务或一些黑客方式)来检索已爬网页面内容?抓取源是网站。
提前谢谢, 乔治答案 0 :(得分:1)
“抓取内容”是什么意思?听起来您想知道抓取的内容是否存储在MS Search Server中?如果是这样,那就不是。
虽然我不知道MSS的内部算法等是如何工作的,但它基于MOSS的搜索,后者又使用 "a tuned version of the engine in MS Desktop Search" 。只有索引存储在搜索服务器中。
可以在 here 中找到有关MOSS(以及MSS)索引编制方式的更多信息。