法语中的Elasticsearch雪球没有正确地阻止

时间:2016-03-18 15:23:37

标签: elasticsearch stemming snowball

我在法语中看到了同一词干的问题。

以下是一个示例:snowball in French

curl -XDELETE http://localhost:9200/stacko36088193
curl -XPOST http://localhost:9200/stacko36088193 -d '
{
  "index": {
    "number_of_shards": 1,
    "analysis": {
      "analyzer": {
        "my_analyzer": {
          "type": "snowball",
          "language" : "French"
        }
      }
    }
  }
}'
curl 'localhost:9200/stacko36088193/_analyze?pretty=1&analyzer=my_analyzer' -d 'développeur développeuse'

并查看token

{
  "tokens" : [ {
    "token" : "développeur",
    "start_offset" : 0,
    "end_offset" : 11,
    "type" : "<ALPHANUM>",
    "position" : 1
  }, {
    "token" : "développ",
    "start_offset" : 12,
    "end_offset" : 24,
    "type" : "<ALPHANUM>",
    "position" : 2
  } ]
}

你怎么能对所有这些词都有相同的词干?

0 个答案:

没有答案