我正在尝试使用elasticsearch crawler https://github.com/codelibs/elasticsearch-river-web
我正确地完成了所有提到的步骤,但我不知道如何启动爬虫
启动抓取工具
./ bin / riverweb --config-id [config doc id] --cluster-name [Elasticsearch Cluster Name] --cleanup 例如,
如何做到这一步??? 我不知道他的意思是什么剂量或使用哪种工具!!
答案 0 :(得分:0)
您必须在目录中执行命令。(./bin/riverweb --config-id my_web --cluster-name elasticsearch --cleanup)
。
例如,我已经下载了 elasticsearch-river-web-1.5.1.tar.gz ,所以我解压缩了这个tar,然后我进入目录( elasticsearch-river- web-1.5.1 )我执行命令。
此外,目录中有一个文件夹,您可以在其中查看日志,文件名称为 riverweb.log 。
干杯