Elasticsearch如何为字段定义波斯逗号分析器?

时间:2016-08-01 10:20:05

标签: php elasticsearch analyzer persian

我在一个类型中为每个字段定义了一种语言,其中一个字段可能包含不同语言的逗号分隔的单词,例如我有一个名为field1的字段,用于两种语言field1.en用于英语和波斯语field1.pr。 那么如何为Persian定义自定义逗号分析器呢? 我们可以在正常情况下定义自定义逗号分析器:

"analysis" => [
   "tokenizer" => [
      "comma" => [
         "type" => "pattern",
         "pattern" => ","
      ]
   ],
   "analyzer" => [
      "comma" => [
         "type" => "custom",
         "tokenizer" => "comma"
      ]
   ]
]

假设在映射中我有一个字段应该存储波斯语逗号分隔的单词,现在我如何定义这样的anylyzer?或者这个逗号分析器会支持波斯语逗号分隔的单词吗?

以及关于elasticsearch的另一个问题,如何使用Pashto语言解决问题?我没有找到任何有弹性的方法来支持普什图文本的分析。

0 个答案:

没有答案