分布式系统的术语:节点,分片,集群

时间:2017-01-16 10:46:42

标签: mongodb elasticsearch cluster-computing distributed-computing sharding

我很难理解分布式计算的不同术语:

1)。什么是节点?它只是分布式系统中的number of machines还是由单个机器运行的number of processes

2)。 分片群集中的分片之间的关系是什么?

3)。我知道分片是使用分片键在多个分片中分隔表/集合内的数据。分片为physical separation还是logical separation

3 个答案:

答案 0 :(得分:1)

到1)

节点是指群集中的一台计算机。套接字是指机器的一个处理器。核心是指套接字的一个处理单元。 cpu通常与核心相同。

例如,天河2号作为一个集群 - 拥有130,000个节点,260,000个插槽和3,120,000个核心。 https://www.top500.org/system/177999

答案 1 :(得分:1)

考虑到你的问题中的elasticsearch标签,这是弹性搜索的nomemclature:

根据https://www.elastic.co/guide/en/elasticsearch/guide/current/_an_empty_cluster.html

Elasticsearch节点:

  

节点是Elasticsearch的正在运行的实例

Elasticsearch群集

  

群集由一个或多个具有相同cluster.name的节点组成,这些节点共同协作以共享其数据和工作负载。

根据https://www.elastic.co/guide/en/elasticsearch/guide/current/_add_an_index.html

Elasticsearch Shard

  

分片是一个低级工作单元,只保存索引中所有数据的一部分。

     

分片是Lucene的单个实例,并且本身就是一个完整的搜索引擎

好的,现在我们已经在Elasticsearch中看到了Cluster,Node和Shard的概念。我们可以看到这些定义与xosp7tom给出的定义非常不同(因为特定于ES)。

如果您想获得有关Elasticsearch团队如何构建其分布式搜索引擎的更多信息,那么可以阅读elasticsearch章节:https://www.elastic.co/guide/en/elasticsearch/guide/current/distributed-cluster.html。这非常有趣,是对分布式系统的一个很好的介绍!

答案 2 :(得分:0)

我从这里找到了所有答案并清除了混淆:Elastic Search 5.x: Basic Concepts

注意:此reference guide适用于5.x version。我正在查看2.x version,之前对这些问题没有明确的解释。@ Artholl在他的回答中提供的链接也属于2.x