Python:使用statsmodels估算Pandas DataFrame中NumPy数组的百分位数

时间:2015-05-07 18:56:11

标签: python arrays numpy pandas statsmodels

我的DataFrame(df.data)中有一个列,其中每个条目都是1-D NumPy数组,我正在尝试计算两个新列:一个是KDE估计的该数组的第25个百分点,另一种是同样手段的第75百分位数。我尝试过以下方法:

df.data.apply(lambda x: pd.Series({'25th': get_25(x), '75th': get_75(x)}))

使用以下功能:

def get_25(data):
    KDE = kde.KDEUnivariate(data)
    KDE.fit()
    p25 = KDE.icdf(25.0)
    return p25

def get_75(GmSc):
    KDE = kde.KDEUnivariate(data)
    KDE.fit()
    p75 = KDE.icdf(75.0)
    return p75

我一直在寻找类似的方法一段时间,但没有发现任何有用的东西。我完全被困在这里。

编辑:很抱歉不清楚。我不是试图返回数组中每个值的百分位数,而是根据我的DataFrame中估计的数据内核密度返回某些百分位数的值。我是否正确使用我发布的代码执行此操作?

0 个答案:

没有答案