有人可以告诉我,我需要为MOSS 2007中的内容抓取帐户授予哪些权限?
当我对内容进行抓取时,我收到一条错误消息,告诉我它没有权限并将其全部读取到Web应用程序,我试图无效。
一切顺利
答案 0 :(得分:1)
取决于您的环境,请参阅此technet article以获取参考/见解,它可能与您正在使用的帐户所在的群组有关...
答案 1 :(得分:0)
答案 2 :(得分:0)
Colin的文章链接引用的环回错误绝对是一个很好的开始。确定环回错误是否在进行中的一种快速方法是尝试直接从托管它的服务器访问您的站点。如果您在MOSS WFE上打开IE(或您选择的浏览器)并且可以访问该站点,那么环回错误不是问题。另请注意,该错误仅影响在端口80上运行的站点。
您是否看到任何其他例外情况?搜索爬虫帐户没有什么特别之处。它应该是没有特殊权限的标准用户帐户除之外,应在服务器场中的每个Web应用程序上为其建立完整读取Web应用程序策略。当您将帐户指定为SSP中的默认内容抓取帐户时,MOSS通常会自行处理此问题。
如果您有一个或多个网站集位于您尝试调用的URL的根目录之下,但实际上根本没有网站集,则会出现另一个模糊的抓取工具问题(即,顶级网站集。)
例如,如果您有网站,MOSS通常无法抓取并报告问题:
<强> http://www.testurl.com/sites/samplesite 强>
<强> http://testserver:8000/randomsite 强>
...但是这里没有相应的顶级网站集:
<强> http://www.testurl.com 强>
<强> http://testserver:8000 强>
如果您正在尝试抓取没有顶级网站集的Web应用程序,我的建议是在那里创建一个。如果没有Web应用程序中的顶级站点,许多事情都无法正常工作:InfoPath表单发布,metablog API发布(发布到博客)等等。每个事情都试图从根URL开始,并且当网站集不存在时,它们会失败。
如果无法创建顶级网站集,则可以解决托管路径问题。将Web应用程序的(root)管理路径从显式包含更改为通配符也应该有效。
我希望这有帮助!