如何使用python聚类稀疏向量?

时间:2016-05-05 08:58:05

标签: python cluster-computing sparse-matrix

嗨,事先抱歉我的英文不好

我有一个很大的稀疏矩阵,但我没有使用任何库。如果项目属于矢量,那么我在列表中添加其编号。我看到了csr矩阵(numpy)的实现,我认为其他两个数组对我的需求是不必要的。

例如

John在同一个市场上买了[cut,dog,nokia 6300,nissan X-Trail,一杯茶],我的数据已经聚集在一起(确实,有很多种商品)。

假设这个东西在所有东西的向量空间中有[5,100,2323532532532,546,3]个数字,那么我只是将它附加到John的事物列表中。这意味着在John购买的所有东西的大矢量中,具有这些数字的地方将为1,其他数字将为0.

我需要对这组矢量进行聚类。也许有人知道这方面的任何工具?或者有一些好的资源来手动写这个?

我想使用DBSCAN

0 个答案:

没有答案