例如,我有
arr=np.linspace(0,1,11)
我希望标记数字n<0.25
标记"a"
,n>0.75
标记"c"
,标记"b"
之间的数字。结果将是
array(['a', 'a', 'a', 'b', ..., 'c'])
我尝试了arr[arr<0.25]='a'
之类的东西,但它只会工作一次,因为在下一个命令中会有与float相比较的字符串。我可以通过在使用for循环进行比较之前检查其类型来实现这一点,但它很复杂。是否有直接的方法来实现这一目标?
答案 0 :(得分:1)
要创建包含三个此类组的数组,您可以执行以下操作 -
ID = (arr>0.75)*1 + (arr>=0.25)
select_arr = np.array(['a','b','c'])
out = select_arr[ID]
示例运行 -
In [64]: arr # Modified from sample posted in question to include 0.75
Out[64]:
array([ 0. , 0.1 , 0.2 , 0.3 , 0.4 , 0.5 , 0.6 , 0.7 , 0.75,
0.9 , 1. ])
In [65]: ID = (arr>0.75)*1 + (arr>=0.25)
...: select_arr = np.array(['a','b','c'])
...: out = select_arr[ID]
...:
In [66]: out
Out[66]:
array(['a', 'a', 'a', 'b', 'b', 'b', 'b', 'b', 'b', 'c', 'c'],
dtype='|S1')
答案 1 :(得分:0)
NumPy数组是同类的。您必须为标签数组
设置类型import numpy as np
arr=np.linspace(0,1,11)
lbl=np.empty((arr.shape), dtype=object)
lbl[arr<.25]='a'
lbl[(arr>=.25) & (arr <=.75)] = 'b'
lbl[arr>.75]='c'
print arr
print lbl
输出:
[ 0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1. ]
['a' 'a' 'a' 'b' 'b' 'b' 'b' 'b' 'c' 'c' 'c']