cluster-analysis - 将基于矢量的聚类算法应用于社交网络环境

将基于矢量的聚类算法应用于社交网络环境

时间：2018-02-20 15:36:21

标签： cluster-analysis k-means

我将社交网络描述为文件中的边缘。我使用基于图形的聚类算法来查找图的密集部分。然而，还有基于向量的聚类，我需要应用于我拥有的数据，但我找不到任何上下文。考虑到它们的功能，我还有关于每个节点的信息。我认为使用包含每个用户功能的向量在这里没有任何意义。例如，k-Means将计算用户u1与其特征向量v1 = [f1，f2，f3，...]和用户u2之间的距离，其特征向量为v2 = [f1，f2，f3，...]。但是，两个向量都具有二进制值，具体取决于用户具有的功能。另外，我有一个矩阵，用户在一个轴上，而另一个用户可以设置权限。

我现在的问题是，如何在本主题的背景下使用k-means，dbscan等。

祝福。

1 个答案:

答案 0 :(得分：0)

可以修改许多算法以允许与二进制要素的距离一起使用。例如，可以为二进制数据修改k-means：k-modes。

但我认为它不会对您的数据做任何有用的事情。

你解决这个问题很糟糕：首先决定算法，然后尝试让它运行。然后你必须解决错误的问题。相反，首先将问题形式化，在数学中，这将是一个很好的聚类。然后通过它的数学能力找出合适的算法，找到一个很好的解决方案。