我有两个数据框,一个(p)df包含要转换的列,第二个(a)包含pd.series形式的转换参数:
p=np.random.rand(5,3) #create data frame
cols=["A","B","C"]
df1=pd.DataFrame(p,columns=cols)
a=np.array([0.3,0.4,0.5]) # create series of transform parameters
a=pd.Series(a,index=cols)
我徘徊如何迭代df列以使用适当的变换参数转换每个列,如下所示:
df1.apply(stats.boxcox,lmbda=a)
当然不起作用。我的临时解决方案只是一个暴力函数:
def boxcox_transform(df,lambdas):
df1=pd.DataFrame(index=df.index)
for column in list(df):
df1[column]=stats.boxcox(df[column],lambdas[column])
return(df1)
boxcox_transform(df1,a)
我徘徊是否有更优雅的解决方案,例如R CRAN mapply
可以迭代两个列表
答案 0 :(得分:1)
您可以使用lambda:
result_df = df1.apply(lambda col: stats.boxcox(col, a.loc[col.name]))