python中的随机样本

时间:2011-12-31 11:55:58

标签: python performance random sample xrange

我想加快速度:

import random
ndim = 50000
for i in xrange(ndim):
   random.sample([j for j in xrange(ndim) if j != i], 30000)

我正在考虑使用NumPy,但不知道如何使用。

3 个答案:

答案 0 :(得分:1)

来自NumPy Docs -

  

numpy.random.sample(大小=无)

     

在半开区间[0.0,1.0]中返回随机浮点数。

>>> np.random.random_sample()
0.47108547995356098
>>> np.random.random_sample((5,))
array([ 0.30220482,  0.86820401,  0.1654503 ,  0.11659149,  0.54323428])

所以如果你的ndim = 50000,那么你可以从上面得到一个随机样本&乘以ndim&把它四舍五入到一个int。这可能有用......

答案 1 :(得分:1)

使用NumPy的可能解决方案是:

import numpy as np
from numpy.random import randint

ndim  = 50000
mndim = ndim -1
base = np.arange(1, ndim)
# addr = np.ones(mndim, dtype=int)
# addr[0] = 0
for i in xrange(5000):
     base[randint(0, mndim, 30000)]
     try:
        base[i] = i
     except IndexError:
        pass

答案 2 :(得分:1)

使用在使用后为下一轮更新的允许值x列表:

import random
s = 3000
ndim = 5000

x = range(1, ndim)
for i in xrange(ndim):
   random.sample(x, s)
   if(i < ndim - 1): x[i] = i #update