假设我有这样的数据:
import pandas as pd
import statsmodels.formula.api as smf
sample_data = pd.read_csv('sample_data.csv',index_col = 0,header = 0)
sample_data
我想探讨年龄对计数的影响。如果我想从数据中消除性别的影响,我将执行两步回归,使用计数与性别的残差,以及残差与年龄的回归,如下所示:
sex_corrl = smf.ols('Counts ~ Sex',data = sample_data).fit()
sample_data['Residuals of Sex'] = list(sex_corrl.resid)
sex_adj_corrl = smf.ols('Q("Residuals of Sex") ~ Age',data = sample_data).fit()
sex_adj_corrl.summary()
我的问题是,如果我在两步回归分析的最后获取R2值(0.013值)的平方根,它是Pearson的相关系数吗?如果没有,我将如何计算经过性别调整的皮尔逊相关系数?