使用FSCrawler在Elasticsearch中创建索引

时间:2017-10-26 12:59:55

标签: elasticsearch

我让FSCrawler处理DEV框,其中文档与FSCrawler和ElasticSearch位于同一服务器上。在_settings.json文件中,我只是将url设置为我的文档位置,格式为" D:\ MyDocs"

现在我将elasticsearch和fscrawler移动到新服务器上并将文档放在单独的服务器上。我现在应该如何格式化我的_settings.json文件中的url值?

所以我(每个都是物理上不同的服务器)1。WebServer,2。文件服务器,3。搜索服务器

elasticsearch和fscrawler在服务器3上。

我可以将网络驱动器从服务器2映射到服务器3,然后如上所示映射,或者我可以在指向文档服务器的Web服务器上的iis中创建一个网站,然后只使用http://mydocsite/ ... .....,

我真的不想映射网络驱动器,我真的不想通过网站公开文档服务器。有没有更好的方法呢?

1 个答案:

答案 0 :(得分:0)

您可以使用SSH连接到文档服务器,如fscrawler文档中所示。这将让您直接索引文档服务器中的文件。 您可以对settings.json进行以下更改

{
  "name" : "test",
  "fs" : {
    "url" : "/path/to/data/dir/on/server"
  },
  "server" : {
    "hostname" : "mynode.mydomain.com",
    "port" : 22,
    "username" : "username",
    "password" : "password",
    "protocol" : "ssh"
  }
}