我有一个数组,其中第一行是一个类别,第二行是子类别,第三行是我想要压缩的值。
我试图重新安排阵列A
[[ 4 4 19 19 20 21 25 26 26 27 27 29] # category
[ 1 2 1 2 1 2 1 1 2 1 2 2] # subcategory
[ 1 1 3 3 1 2 1 1 1 2 2 2]] # count
进入数组B
[[ 4 19 20 21 25 26 27 29] # category
[ 1 3 1 0 1 1 2 0] # subcategory 1 count
[ 1 3 0 2 0 1 2 2]] # subcategory 2 count
我到目前为止
categories, subcategories = np.unique(A[0], return_counts=True)
B = np.zeros((np.amax(subcategories) + 1, A[0].size))
B[0] = categories
但不确定如何填充其余部分。有什么想法吗?
答案 0 :(得分:1)
这应该可以解决问题:
cat_index = np.searchsorted(categories, A[0])
B[A[1], cat_index] = A[2]
答案 1 :(得分:1)
即使输入没有排序,这也应该有效:
import numpy as np
A = np.array(
[[ 4, 4,19,19,20,21,25,26,26,27,27,29], # category
[ 1, 2, 1, 2, 1, 2, 1, 1, 2, 1, 2, 2], # subcategory
[ 1, 1, 3, 3, 1, 2, 1, 1, 1, 2, 2, 2]]) # count
values, inverse = np.unique(A[0], return_inverse=True)
B = np.zeros((3, len(values)))
B[0] = values
B[1,inverse[A[1] == 1]] = A[2,A[1] == 1]
B[2,inverse[A[1] == 2]] = A[2,A[1] == 2]
给出了:
[[ 4 19 20 21 25 26 27 29]
[ 1 3 1 0 1 1 2 0]
[ 1 3 0 2 0 1 2 2]]