并行聚类与治愈

时间:2014-04-28 00:07:42

标签: algorithm parallel-processing cluster-analysis

我是新来的,对于问题格式中的任何错误感到抱歉。

我试图创建一个聚类数据的算法,我想使用CURE并且并行执行(可能使用mpi但是太早了)。 无论如何,据我所知,CURE是一种两遍算法,它首先对数据进行部分聚类,然后聚类创建的部分聚类。所以,我的想法是在每个节点上进行第一次传递,这样每个人都将创建初始聚类,第二次传递将通过合并不同节点中的聚类来完成。 我的问题和我的实际问题是如何确保适当节点之间的通信,因为算法必须合并“关闭”的群集。但是位于不同的节点。 是否最好计算“主人”中群集之间的距离。然后将决定哪些节点通信的节点?另一个想法是每个节点计算每个本地集群与每个远程集群之间的距离,并在满足距离标准时进行合并,在这种情况下,每个节点当然必须知道每个集群的代表。我的想法是否正确或是否有更有效的方法来完成这样的任务?我被引导相信我的第一个想法是每个节点计算本地和远程集群之间的距离是不可扩展的,所以我想找到一种正确的方法。对于稍后的实现,我肯定会使用MPI和C来编写实际代码

0 个答案:

没有答案