我很难理解分布式计算的不同术语:
1)。什么是节点?它只是分布式系统中的number of machines
还是由单个机器运行的number of processes
?
2)。 分片与群集中的分片之间的关系是什么?
3)。我知道分片是使用分片键在多个分片中分隔表/集合内的数据。分片为physical separation
还是logical separation
?
答案 0 :(得分:1)
到1)
节点是指群集中的一台计算机。套接字是指机器的一个处理器。核心是指套接字的一个处理单元。 cpu通常与核心相同。
例如,天河2号作为一个集群 - 拥有130,000个节点,260,000个插槽和3,120,000个核心。 https://www.top500.org/system/177999
答案 1 :(得分:1)
考虑到你的问题中的elasticsearch标签,这是弹性搜索的nomemclature:
根据https://www.elastic.co/guide/en/elasticsearch/guide/current/_an_empty_cluster.html
Elasticsearch节点:
节点是Elasticsearch的正在运行的实例
Elasticsearch群集
群集由一个或多个具有相同cluster.name的节点组成,这些节点共同协作以共享其数据和工作负载。
根据https://www.elastic.co/guide/en/elasticsearch/guide/current/_add_an_index.html
Elasticsearch Shard
分片是一个低级工作单元,只保存索引中所有数据的一部分。
分片是Lucene的单个实例,并且本身就是一个完整的搜索引擎
好的,现在我们已经在Elasticsearch中看到了Cluster,Node和Shard的概念。我们可以看到这些定义与xosp7tom给出的定义非常不同(因为特定于ES)。
如果您想获得有关Elasticsearch团队如何构建其分布式搜索引擎的更多信息,那么可以阅读elasticsearch章节:https://www.elastic.co/guide/en/elasticsearch/guide/current/distributed-cluster.html。这非常有趣,是对分布式系统的一个很好的介绍!
答案 2 :(得分:0)
我从这里找到了所有答案并清除了混淆:Elastic Search 5.x: Basic Concepts
注意:此reference guide
适用于5.x version
。我正在查看2.x version
,之前对这些问题没有明确的解释。@ Artholl在他的回答中提供的链接也属于2.x