嗨,事先抱歉我的英文不好
我有一个很大的稀疏矩阵,但我没有使用任何库。如果项目属于矢量,那么我在列表中添加其编号。我看到了csr矩阵(numpy)的实现,我认为其他两个数组对我的需求是不必要的。
例如
John在同一个市场上买了[cut,dog,nokia 6300,nissan X-Trail,一杯茶],我的数据已经聚集在一起(确实,有很多种商品)。
假设这个东西在所有东西的向量空间中有[5,100,2323532532532,546,3]个数字,那么我只是将它附加到John的事物列表中。这意味着在John购买的所有东西的大矢量中,具有这些数字的地方将为1,其他数字将为0.
我需要对这组矢量进行聚类。也许有人知道这方面的任何工具?或者有一些好的资源来手动写这个?
我想使用DBSCAN