Question

我有一个数组，其中第一行是一个类别，第二行是子类别，第三行是我想要压缩的值。

我试图重新安排阵列A

[[ 4  4 19 19 20 21 25 26 26 27 27 29]  # category
 [ 1  2  1  2  1  2  1  1  2  1  2  2]  # subcategory
 [ 1  1  3  3  1  2  1  1  1  2  2  2]] # count

进入数组B

[[ 4 19 20 21 25 26 27 29]  # category
 [ 1  3  1  0  1  1  2  0]  # subcategory 1 count
 [ 1  3  0  2  0  1  2  2]] # subcategory 2 count

我到目前为止

categories, subcategories = np.unique(A[0], return_counts=True)
B = np.zeros((np.amax(subcategories) + 1, A[0].size))
B[0] = categories

但不确定如何填充其余部分。有什么想法吗？

Answer 1

这应该可以解决问题：

cat_index = np.searchsorted(categories, A[0])
B[A[1], cat_index] = A[2]

Answer 2

即使输入没有排序，这也应该有效：

import numpy as np

A = np.array(
    [[ 4, 4,19,19,20,21,25,26,26,27,27,29],  # category
     [ 1, 2, 1, 2, 1, 2, 1, 1, 2, 1, 2, 2],  # subcategory
     [ 1, 1, 3, 3, 1, 2, 1, 1, 1, 2, 2, 2]]) # count

values, inverse = np.unique(A[0], return_inverse=True)

B = np.zeros((3, len(values)))
B[0] = values
B[1,inverse[A[1] == 1]] = A[2,A[1] == 1]
B[2,inverse[A[1] == 2]] = A[2,A[1] == 2]

给出了：

[[ 4 19 20 21 25 26 27 29]
 [ 1  3  1  0  1  1  2  0]
 [ 1  3  0  2  0  1  2  2]]

在NumPy数组中将值转换为行索引

2 个答案: