如何将Pandas DataFrame中的列提升为连续幂

时间:2019-10-11 20:22:09

标签: python pandas numpy pow

是否有一种Python方法将DataFrame(xRaw)中的列提升为连续的幂?是否有

之类的东西
xRaw[:,k] = xRaw.pow(k) for k in range(1,6)

3 个答案:

答案 0 :(得分:10)

这是一个Vandermonde矩阵,numpy具有np.vander的内置函数

如果有

s = pd.Series([1,2,3,4,5])

然后

np.vander(s, 6)

array([[   1,    1,    1,    1,    1,    1],
       [   1,    2,    4,    8,   16,   32],
       [   1,    3,    9,   27,   81,  243],
       [   1,    4,   16,   64,  256, 1024],
       [   1,    5,   25,  125,  625, 3125]])

要添加回df,可以使用concat

df = pd.concat([df, pd.DataFrame(vander)], axis=1)

答案 1 :(得分:4)

数字广播

s.values**np.arange(6)[:,None]
Out[70]: 
array([[   1,    1,    1,    1,    1],
       [   2,    4,    8,   16,   32],
       [   3,    9,   27,   81,  243],
       [   4,   16,   64,  256, 1024],
       [   5,   25,  125,  625, 3125]], dtype=int64)

重新分配

s= pd.concat([s, pd.DataFrame(s.values**np.arange(6)[:,None],index=s.index)], axis=1)

答案 2 :(得分:2)

我会做的:

for i in range(6):
    xRaw["power: "+str(i)] = xRaw[column_to_be_raised] ** i

这将生成一个新列,该列以您要针对给定范围内的每个指数提高的列为基础。