按列将回归应用于熊猫df,并将结果打印到新df

时间:2018-10-26 12:38:48

标签: python pandas regression

所以可以说您有一个像这样的数据框:

names = (['A', 'B', 'C', 'D', 'E'])
df = pd.DataFrame(np.random.randn(50,5), columns=[names])

我想对每列与第一列的数据进行回归分析。我已经进行了大量的谷歌搜索,并且知道我需要遍历各个列,但是我有些卡住了。

这显然是我的垃圾尝试:

for column in df.columns[1:]:
  slope, intercept, r_value, p_value, std_err = sp.stats.linregress(df['A'], column)

哪个给我:

TypeError: cannot perform reduce with flexible type

任何帮助将不胜感激!

只是为了澄清,我不想对A,B,C,D,E的每一行都拟合回归。我想对每个列的行中存储的数据分别拟合回归。因此,总共有5个回归。我针对重复进行的问题按行计算回归。

输出类似于:

Column Slope R2 PVal 
A 0.2 0.6 1.0
B 0.7 0.3 2.0

不是链接到重复标记的问题中的逐行解决方案

0 个答案:

没有答案