用于假人的Mysql集群

时间:2013-08-02 08:20:15

标签: mysql cluster-computing scalability

群集背后的想法是什么?

  1. 您有多台计算机具有相同的数据库副本,您可以在其中传播读/写?这是对的吗?

  2. 这个想法如何运作?当我进行选择查询时,集群会分析哪个服务器的读/写次数较少,并将我的查询指向该服务器?

  3. 当你应该开始使用群集时,我知道这是一个棘手的问题,但是有人可以给我一个例子,例如100万次访问和1亿行DB。

2 个答案:

答案 0 :(得分:10)

1)Correct。每个数据节点都不保存集群数据的完整副本,但每一位数据都存储在至少两个节点上。

2)Essentially correct。 MySQL Cluster支持分布式事务。

3)当不再可能进行垂直缩放时,复制变得不切实际:)


正如所承诺的,一些推荐读物:

答案 1 :(得分:2)

1->你的第一点在某种程度上是正确的。但我认为如果多台机器共享相同的数据,它将是复制而不是群集。 在聚类中,数据在各种机器之间划分,并且存在水平分区意味着数据的划分基于行,在这些机器中使用某种算法划分记录。

数据的划分是这样完成的,即每个记录都会得到一个唯一的密钥,就像一个键值对一样,每台机器也有一个唯一的machine_id相关,用于定义哪个键值对去哪台机器。

我们将每台机器称为一个集群,每个集群由一个单独的mysql服务器,单个数据和一个集群管理器组成。并且所有集群节点之间都有一个数据共享,以便所有数据都可用于每个节点随时。

通过memcached设备/服务器完成数据检索,以便快速检索和 还有一个用于特定群集的复制服务器来保存数据。

2->是的,有可能因为在所有集群节点之间共享所有数据。并且你也可以使用负载均衡器来平衡负载。但负载均衡器的想法很常见,因为它们被大多数服务器使用。但如果你只是为了你的知识而尝试,那就没有必要,因为你不会注意到产生负载均衡器要求的负载类型,集群管理器本身可以完成所有工作。

3-> RandomSeed是对的。当你的复制变得不切实际时,你确实觉得需要一个集群意味着如果你使用主服务器进行写入,那么当流量变得很大以致服​​务器无法顺利运行时你会觉得需要聚类。只是为了加快整个过程。 这不是唯一的情况,这只是一种情况,这只是一个案例。

希望这对你有所帮助!!