我有一个电话,它向熊猫系列添加了一些随机值:
series = series.apply(lambda x: int(math.ceil(x + x * rand_value(range))))
出于性能原因,我不能再使用pandas.Series了,而必须使用numpy数组。
想象一下我的一维数组数据存储在a
中,如何将调用从上面转换为numpy?我读到有关np.vectorize
的内容,但我不知道如何将其与lambda和自制函数一起使用。
我的想法:
func = np.vectorize(lambda x: int(math.ceil(x + x * rand_value(range))))
a = func(a)
乍一看,这两个调用都导致相同的输出,但是我不确定。你能确认吗?
有没有比使用np.vectorize()
更好的方法了?
编辑:rand_value(range)的定义如下:
def rand_value(range):
# create value between [-1; 1)
rand = np.random.rand()*2.0 - 1.0;
rand = (rand * float(range)) / 100.0
return rand
所以我不能使用np.ceil
,因为那样我的函数将只被调用一次(?),并且总是具有相同的rand值,我需要的是,对于数组中的每个值,该函数都会叫。
答案 0 :(得分:0)
通过将形状传递给np.random.rand()
,您可以获得多个随机值。一旦具有与输入数组一样多的随机值,就可以使用普通的numpy函数
import numpy as np
def rand_value(range, shape=None):
if shape is None:
shape = tuple()
rand = np.random.rand(*shape) * 2.0 - 1.0
rand = rand * range / 100.0
return rand
data = np.arange(16)
# array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
rand_value(100.0, shape=data.shape)
# array([-0.0083601 , 0.90346962, -0.70813122, -0.73467017, 0.87514163,
# -0.29496392, 0.63828971, -0.10086984, -0.60248423, 0.26550601,
# -0.17577315, -0.95178997, 0.64123385, -0.54732105, 0.28590572,
# 0.19727859])
np.ceil(data + data * rand_value(100.0, shape=data.shape)).astype(int)
# array([ 0, 1, 4, 6, 8, 4, 9, 3, 4, 17, 10, 18, 16, 12, 16, 30])