elasticsearch中的术语令人困惑

时间:2014-01-22 06:08:54

标签: elasticsearch

由于我不熟悉弹性搜索,我在弹性搜索方面存在困惑。

 1) shard
 2) cluster
 3) difference between number_of_nodes and number_of_data_nodes
 4) difference active_primary_shards  and active_shards
 5) relocating_shards 
 6) unassigned_shards 

启动elasticsearch时显示为5个分片。但插入数据后,分片不断增加。我不知道分片的默认设置是什么。

提前感谢!

1 个答案:

答案 0 :(得分:0)

  • 每次尝试插入新文档时,您的分片是否会增加10?
  • 在尝试插入文档之前,您确定要将文档插入到已创建的索引中吗? Ť

他之所以我问,当你尝试插入文档时,分片是否增加了10,那么你将不会插入已经创建的索引,而是基于ElasticSearch'创建一个全新的索引的默认值。其中 5个碎片和1个副本,意味着10个碎片(1副复制副本以复制主碎片)。

例如,以下是如何创建索引并完全控制创建分片的数量 -

curl -XPUT <host>:<port>/<index> -d '{
"settings": {
        "number_of_shards": 2,
        "number_of_replicas": 0,
        "analysis": {
            "analyzer": {
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
             },
             "filter": {
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
              ..........
             }
        }
    }
}'
  1. A shard in ElasticSearch本质上是一个Lucene实例。
  2. ElasticSearch中的
  3. A cluster本质上是一个或多个包含相同群集名称的节点,允许它们连接在一起以分布式分散分片。
  4. 数据节点的数量本质上是不仅仅是协调节点的节点的数量,即将接收搜索请求的节点,可能是主节点以及将保持和包含数据(分片)的节点。协调器节点仅将请求分发给数据节点。
  5. 活动主分片是群集中节点上可用的主分片,活动分片将包含该计数中的副本。
  6. 重定位分片是那些可能迁移到同一群集中的不同节点的分片,这是由于新节点加入群集,并且随着ElasticSearch的分发,它将移动分片以重新平衡群集,从而确保可用性。
  7. 未分配给节点的碎片。