问题更新:感谢Okke Klein的更新。
我正在尝试在任何地方实施抓取以抓取doc文件夹。
我按照http://www.crawl-anywhere.com/installation-v300/
中指定的指示操作安装了tomcat和Apache Web服务器。
所以我尝试使用:: http /// crawler登录到crawler。
但我收到消息
在此服务器上找不到请求的网址/抓取工具。
localhost端口80上的Apache / 2.0.64(Win32)服务器
对于:// ip:8180 / crawlerws它给出了:
<error>
<errno>1</errno>
<errmsg>Missing action</errmsg>
</error>
任何人都可以告诉我缺少的内容以及我如何登录爬虫管理员。
答案 0 :(得分:0)
Crawler管理员不在Tomcat下运行。它在Apache下运行。
看起来您的Solr还没有运行。但是,Admin界面不需要这样做。
crawlerws运行良好,看着响应。但这仅适用于管理界面中的某些交互,并不重要。
因此,重新阅读Apache设置部分以使Admin接口运行。它可能已在http://ip:80/crawler
下运行。