如何将带有标签的距离值存储到距离矩阵中?

时间:2017-11-04 16:23:19

标签: python matrix distance-matrix

我试图将所有给定文档之间的距离存储到距离矩阵中。

这是我的代码:

    dists = [] #a matrix of distances
    i=0
    for row in self.matrix:
        current_row = row
        document_distances = []
        # build list with possibilities for every document in labels
        for label in self.labels:
            document_distances.append((1 - self.row_distance(current_row, label), label))

        dists[i] = document_distances #[(0.22529600444665132, 'Doc1'), (0.22952074233187614, 'Doc2'), (0.289625872768411, 'Doc3'), ...]
        i += 1
    print(dists)

但在运行代码后,我收到以下错误:

IndexError: list assignment index out of range

任何人都可以告诉我应该更改哪些内容以便我的代码能够正常工作?

2 个答案:

答案 0 :(得分:1)

而不是这样做:

dists[i] = document_distances

这样做:

dists.append(document_distances)

答案 1 :(得分:1)

您的代码有一些非常奇怪的陈述:您遍历row,然后将其分配给current_row等。此外,您会跟踪某些计数器。这些都没有必要。

最好的方法可能是使用 list comprehension

dists = [(1 - self.row_distance(row, label), label)
             for row in self.matrix
             for label in self.labels]

这取代了所有代码。

或者,如果您真的需要程序代码,可以使用append

dists = [] #a matrix of distances

for row in self.matrix:
    document_distances = []
    for label in self.labels:
        document_distances.append((1 - self.row_distance(current_row, label), label))

    dists.append(document_distances)
print(dists)