群集背后的想法是什么?
您有多台计算机具有相同的数据库副本,您可以在其中传播读/写?这是对的吗?
这个想法如何运作?当我进行选择查询时,集群会分析哪个服务器的读/写次数较少,并将我的查询指向该服务器?
当你应该开始使用群集时,我知道这是一个棘手的问题,但是有人可以给我一个例子,例如100万次访问和1亿行DB。
答案 0 :(得分:10)
1)Correct。每个数据节点都不保存集群数据的完整副本,但每一位数据都存储在至少两个节点上。
2)Essentially correct。 MySQL Cluster支持分布式事务。
3)当不再可能进行垂直缩放时,复制变得不切实际:)
正如所承诺的,一些推荐读物:
Circular Replication in MySQL(有关冲突的更高级警告)
MySQL Cluster Multi-Computer How-To(分步教程,它假设有多台物理机,但您可以按照these instructions跟随MySQL Performance Blog在同一台机器上运行所有进程来运行测试。
{{3}}是此字段中的参考
答案 1 :(得分:2)
1->你的第一点在某种程度上是正确的。但我认为如果多台机器共享相同的数据,它将是复制而不是群集。 在聚类中,数据在各种机器之间划分,并且存在水平分区意味着数据的划分基于行,在这些机器中使用某种算法划分记录。
数据的划分是这样完成的,即每个记录都会得到一个唯一的密钥,就像一个键值对一样,每台机器也有一个唯一的machine_id相关,用于定义哪个键值对去哪台机器。
我们将每台机器称为一个集群,每个集群由一个单独的mysql服务器,单个数据和一个集群管理器组成。并且所有集群节点之间都有一个数据共享,以便所有数据都可用于每个节点随时。
通过memcached设备/服务器完成数据检索,以便快速检索和 还有一个用于特定群集的复制服务器来保存数据。
2->是的,有可能因为在所有集群节点之间共享所有数据。并且你也可以使用负载均衡器来平衡负载。但负载均衡器的想法很常见,因为它们被大多数服务器使用。但如果你只是为了你的知识而尝试,那就没有必要,因为你不会注意到产生负载均衡器要求的负载类型,集群管理器本身可以完成所有工作。
3-> RandomSeed是对的。当你的复制变得不切实际时,你确实觉得需要一个集群意味着如果你使用主服务器进行写入,那么当流量变得很大以致服务器无法顺利运行时你会觉得需要聚类。只是为了加快整个过程。 这不是唯一的情况,这只是一种情况,这只是一个案例。
希望这对你有所帮助!!