计算非常大的稀疏矢量的距离/接近矩阵的最佳方法是什么? 例如,您将获得以下设计矩阵,其中每行是68771维稀疏向量。
designMatrix < 5830x68771类型稀疏矩阵'' 1229041存储的元素采用压缩稀疏行格式>
答案 0 :(得分:1)
您是否尝试过scipy.spatial.distance
中的例程?
http://docs.scipy.org/doc/scipy/reference/spatial.distance.html
如果这会强迫您进行密集表示,那么根据非零元素的密度,您可能最好自己滚动。您可以在保留新索引和原始索引之间的映射的同时挤出零,计算剩余非零元素上的成对距离,然后使用索引将事物映射回来。