是否有一个相当于pandas.apply的numpy?

时间:2019-11-18 09:08:24

标签: python pandas numpy

我有一个电话,它向熊猫系列添加了一些随机值:

series = series.apply(lambda x: int(math.ceil(x + x * rand_value(range))))

出于性能原因,我不能再使用pandas.Series了,而必须使用numpy数组。

想象一下我的一维数组数据存储在a中,如何将调用从上面转换为numpy?我读到有关np.vectorize的内容,但我不知道如何将其与lambda和自制函数一起使用。
我的想法:

func = np.vectorize(lambda x: int(math.ceil(x + x * rand_value(range))))
a = func(a)

乍一看,这两个调用都导致相同的输出,但是我不确定。你能确认吗?
有没有比使用np.vectorize()更好的方法了?

编辑:rand_value(range)的定义如下:

def rand_value(range):

    # create value between [-1; 1)
    rand = np.random.rand()*2.0 - 1.0; 

    rand = (rand * float(range)) / 100.0

    return rand

所以我不能使用np.ceil,因为那样我的函数将只被调用一次(?),并且总是具有相同的rand值,我需要的是,对于数组中的每个值,该函数都会叫。

1 个答案:

答案 0 :(得分:0)

通过将形状传递给np.random.rand(),您可以获得多个随机值。一旦具有与输入数组一样多的随机值,就可以使用普通的numpy函数

import numpy as np

def rand_value(range, shape=None):
    if shape is None:
        shape = tuple()

    rand = np.random.rand(*shape) * 2.0 - 1.0
    rand = rand * range / 100.0
    return rand

data = np.arange(16)
# array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15])
rand_value(100.0, shape=data.shape)
# array([-0.0083601 ,  0.90346962, -0.70813122, -0.73467017,  0.87514163,
#        -0.29496392,  0.63828971, -0.10086984, -0.60248423,  0.26550601,
#        -0.17577315, -0.95178997,  0.64123385, -0.54732105,  0.28590572,
#         0.19727859])
np.ceil(data + data * rand_value(100.0, shape=data.shape)).astype(int)
# array([ 0,  1,  4,  6,  8,  4,  9,  3,  4, 17, 10, 18, 16, 12, 16, 30])