Question

我在一个类型中为每个字段定义了一种语言，其中一个字段可能包含不同语言的逗号分隔的单词，例如我有一个名为field1的字段，用于两种语言field1.en用于英语和波斯语field1.pr。那么如何为Persian定义自定义逗号分析器呢？我们可以在正常情况下定义自定义逗号分析器：

"analysis" => [
   "tokenizer" => [
      "comma" => [
         "type" => "pattern",
         "pattern" => ","
      ]
   ],
   "analyzer" => [
      "comma" => [
         "type" => "custom",
         "tokenizer" => "comma"
      ]
   ]
]

假设在映射中我有一个字段应该存储波斯语逗号分隔的单词，现在我如何定义这样的anylyzer？或者这个逗号分析器会支持波斯语逗号分隔的单词吗？

以及关于elasticsearch的另一个问题，如何使用Pashto语言解决问题？我没有找到任何有弹性的方法来支持普什图文本的分析。

Elasticsearch如何为字段定义波斯逗号分析器？

0 个答案: