我有一个numpy数组,它有shape=(10000,)
。以下是前5个条目:
labels = data[:, 0]
print(labels.shape)
print(labels[0:5])
# prints
# (100000,)
# [1. 1. 1. 0. 1.]
每个条目都是0或1.我想通过映射的元素操作将其映射到2d数组
0 -> [1, 0]
1 -> [0, 1]
我该怎么做?我试过了
labels = np.apply_along_axis(lambda x: [1, 0] if x[0] == 0 else [0, 1], 0, data[:, 0])
但这似乎不起作用。
答案 0 :(得分:2)
In [435]: ref = np.array([[1,0],[0,1]])
In [436]: index = np.array([1.,1.,1.,0.,1.])
使用浮点数进行索引会在最近的版本中出错:
In [437]: ref[index,:]
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-437-d50c95668d6c> in <module>()
----> 1 ref[index,:]
IndexError: arrays used as indices must be of integer (or boolean) type
使用整数进行索引,根据ref
值从index
中选择行:
In [438]: ref[index.astype(int),:]
Out[438]:
array([[0, 1],
[0, 1],
[0, 1],
[1, 0],
[0, 1]])
这是一个可以使用choose
的情况,但它比上述索引更容易看出数组形状:
In [440]: np.choose(index.astype(int)[:,None],[[1,0],[0,1]])
Out[440]:
array([[0, 1],
[0, 1],
[0, 1],
[1, 0],
[0, 1]])
或只有2个转换为布尔值的选项,where
:
In [443]: np.where(index.astype(bool)[:,None],[0,1],[1,0])
Out[443]:
array([[0, 1],
[0, 1],
[0, 1],
[1, 0],
[0, 1]])
答案 1 :(得分:1)
您可以尝试以下
labels = np.array([1,1,1,0,1])
np.eye(np.max(labels) + 1)[labels]
给出:
array([[ 0., 1.],
[ 0., 1.],
[ 0., 1.],
[ 1., 0.],
[ 0., 1.]])
答案 2 :(得分:0)
此方法对原始数组执行xor并将两个数组堆叠在一起。
labels = np.random.randint(0,2, 10000)
# array([0, 0, 1, ..., 1, 1, 0])
np.vstack([(~labels.astype(bool)).astype(int), labels])
array([[1, 1, 0, ..., 0, 0, 1],
[0, 0, 1, ..., 1, 1, 0]])