我在一个类型中为每个字段定义了一种语言,其中一个字段可能包含不同语言的逗号分隔的单词,例如我有一个名为field1
的字段,用于两种语言field1.en
用于英语和波斯语field1.pr
。
那么如何为Persian
定义自定义逗号分析器呢?
我们可以在正常情况下定义自定义逗号分析器:
"analysis" => [
"tokenizer" => [
"comma" => [
"type" => "pattern",
"pattern" => ","
]
],
"analyzer" => [
"comma" => [
"type" => "custom",
"tokenizer" => "comma"
]
]
]
假设在映射中我有一个字段应该存储波斯语逗号分隔的单词,现在我如何定义这样的anylyzer?或者这个逗号分析器会支持波斯语逗号分隔的单词吗?
以及关于elasticsearch
的另一个问题,如何使用Pashto
语言解决问题?我没有找到任何有弹性的方法来支持普什图文本的分析。