Elasticsearch“ _cat / indices” api更新延迟到搜索?

时间:2020-10-21 04:02:34

标签: elasticsearch lucene elasticsearch-performance

Elasticsearch (v7.9.2)有一个API _cat/indices来显示索引状态,对docs.count所做的最后一次更改似乎不可行,直到搜索或其他更新生效制成。

这是为了提高性能吗?

而且,有什么方法可以使其始终保持最新状态吗?


@Update-我如何看待这个问题?

我正在使用Logstash将数据导入es。 在浏览器中,我打开了http://localhost:9200/_cat/indices?v

每次导入后,我都会刷新浏览器页面,通常页面会更改。

logstash完成后,我将其终止,页面中的计数小于源db(例如mysql)中的计数。

然后我一次又一次刷新页面,它不会改变。

但是,当我在postman中发送查询请求以查询es索引,然后再次刷新时,docs.count发生了变化,总计数与源db中的计数相同。

因此,我总结了以下行为:

  • 首先,docs.count会在每次导入(又称插入)之后进行更新。
  • 但是,由于导入过程持续了一段时间,而没有查询索引,因此页面的docs.count停止了更新。
  • 然后,对索引的查询将强制docs.count更新为正确的数字。
  • 之后,将重复上述步骤。 它看起来确实有点像延迟,直到需要优化为止。

而且,来自http://localhost:9200/xxx/_settings索引设置
(根据评论的要求)

{
  "xxx" : {
    "settings" : {
      "index" : {
        "number_of_shards" : "1",
        "provided_name" : "xxx",
        "creation_date" : "1602844600812",
        "analysis" : {
          "analyzer" : {
            "default_search" : {
              "type" : "ik_max_word"
            },
            "default" : {
              "type" : "ik_max_word"
            }
          }
        },
        "number_of_replicas" : "0",
        "uuid" : "qLFMHhyBQNOOs1u_EcJbBg",
        "version" : {
          "created" : "7090299"
        }
      }
    }
  }
}

1 个答案:

答案 0 :(得分:0)

当出现refresh 时,会显示

最后一个文档数。 它将根据refresh.interval设置定期刷新。

摘自文档:Elasticsearch每秒定期刷新一次索引,但仅在最近30秒内收到一个或多个搜索请求的索引上刷新。