我正在尝试计算直方图之间的距离矩阵。我只能找到用于计算2个直方图之间的距离的代码,我的数据超过10个。我的数据是CSV文件,直方图的列总计为100。其中包含大约65,000个条目,我只运行20个%的数据,但是代码仍然不起作用。
我尝试了scipy.spatial.distance_matrix中的 distance_matrix,但它忽略了数据为直方图的面孔,并将其视为普通数值数据。我也尝试了wasserstein距离,但错误是object too deep for desired array
from scipy.stats import wasserstein_distance
distance = wasserstein_distance (df3,df3)
我希望结果会像这样:
0 1 2 3 4 5 6
0 0.000000 259.730341 331.083554 320.302997 309.577373 249.868085
1 259.730341 0.000000 208.368304 190.441382 262.030304 186.033572
2 331.083554 208.368304 0.000000 112.255111 256.269253 227.510879
3 320.302997 190.441382 112.255111 0.000000 246.350482 205.346804
4 309.577373 262.030304 256.269253 246.350482 0.000000 239.642379
但这是一个错误
ValueError: object too deep for desired array