将基于矢量的聚类算法应用于社交网络环境

时间:2018-02-20 15:36:21

标签: cluster-analysis k-means

我将社交网络描述为文件中的边缘。我使用基于图形的聚类算法来查找图的密集部分。然而,还有基于向量的聚类,我需要应用于我拥有的数据,但我找不到任何上下文。考虑到它们的功能,我还有关于每个节点的信息。我认为使用包含每个用户功能的向量在这里没有任何意义。例如,k-Means将计算用户u1与其特征向量v1 = [f1,f2,f3,...]和用户u2之间的距离,其特征向量为v2 = [f1,f2,f3,...]。但是,两个向量都具有二进制值,具体取决于用户具有的功能。另外,我有一个矩阵,用户在一个轴上,而另一个用户可以设置权限。

我现在的问题是,如何在本主题的背景下使用k-means,dbscan等。

祝福。

1 个答案:

答案 0 :(得分:0)

可以修改许多算法以允许与二进制要素的距离一起使用。例如,可以为二进制数据修改k-means:k-modes。

但我认为它不会对您的数据做任何有用的事情。

你解决这个问题很糟糕:首先决定算法,然后尝试让它运行。然后你必须解决错误的问题。相反,首先将问题形式化,在数学中,这将是一个很好的聚类。然后通过它的数学能力找出合适的算法,找到一个很好的解决方案。