python中的邻近矩阵

时间:2011-03-18 14:52:00

标签: python scipy

计算非常大的稀疏矢量的距离/接近矩阵的最佳方法是什么? 例如,您将获得以下设计矩阵,其中每行是68771维稀疏向量。

  
    
      

designMatrix       < 5830x68771类型稀疏矩阵''           1229041存储的元素采用压缩稀疏行格式>

    
  

1 个答案:

答案 0 :(得分:1)

您是否尝试过scipy.spatial.distance中的例程?

http://docs.scipy.org/doc/scipy/reference/spatial.distance.html

如果这会强迫您进行密集表示,那么根据非零元素的密度,您可能最好自己滚动。您可以在保留新索引和原始索引之间的映射的同时挤出零,计算剩余非零元素上的成对距离,然后使用索引将事物映射回来。