所以可以说您有一个像这样的数据框:
names = (['A', 'B', 'C', 'D', 'E'])
df = pd.DataFrame(np.random.randn(50,5), columns=[names])
我想对每列与第一列的数据进行回归分析。我已经进行了大量的谷歌搜索,并且知道我需要遍历各个列,但是我有些卡住了。
这显然是我的垃圾尝试:
for column in df.columns[1:]:
slope, intercept, r_value, p_value, std_err = sp.stats.linregress(df['A'], column)
哪个给我:
TypeError: cannot perform reduce with flexible type
任何帮助将不胜感激!
只是为了澄清,我不想对A,B,C,D,E的每一行都拟合回归。我想对每个列的行中存储的数据分别拟合回归。因此,总共有5个回归。我针对重复进行的问题按行计算回归。
输出类似于:
Column Slope R2 PVal
A 0.2 0.6 1.0
B 0.7 0.3 2.0
不是链接到重复标记的问题中的逐行解决方案