使用numpy random时,选择多次重复的值?

时间:2017-02-20 16:19:35

标签: python numpy random scipy statistics

我想知道当使用numpy random随机生成数字时,如何选择多次重复的值。 我正在做以下事情:

1)首先生成1-10之间的数字

ran = ceil( np.random.random(10)*10 )
print ran
[  2.   9.   8.   9.  10.   8.  10.   7.   1.   1.]

2)现在使用scipy.stats中的itemfreq来获取频率表 第二列是频率。

freq_tmp = itemfreq(ran)
print freq_tmp
[[  1.   2.]
[  2.   1.]
[  7.   1.]
[  8.   2.]
[  9.   2.]
[ 10.   2.]]

print freq_tmp[0:][:,1] 

[ 2.  1.  1.  2.  2.  2.]

这只显示频率,但我想知道重复次数超过1的值,在这个例子中应该是:

[1. 8. 9. 10]

感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

你快到了。您可以像这样在切片器中放置>

import numpy as np

a = np.array([[1,2],[2,1],[7,1],[8,2],[9,2],[10,2]])

print(a[a[:,1] > 1][:,0])

输出:

[ 1  8  9 10]

答案 1 :(得分:1)

另一个愚蠢的解决方案:

In [57]: ran=randint(1,11,10)

In [58]: ran
Out[58]: array([3, 4, 6, 1, 9, 4, 2, 8, 6, 8])

In [59]: uniqs,cnts=np.unique(ran,return_counts=True)

In [60]: uniqs,cnts
Out[60]: (array([1, 2, 3, 4, 6, 8, 9]), array([1, 1, 1, 2, 2, 2, 1], dtype=int64))

In [61]: uniqs[cnts>=2]
Out[61]: array([4, 6, 8])