我正在尝试通过一系列线性回归分析复合指标的所有组成部分对结果值的影响,但会出现值错误。这是我正在使用的代码:
import pandas as pd
from sklearn.linear_model import LinearRegression
import warnings
warnings.filterwarnings('ignore')
ods8 = pd.read_excel (r'path/ODS_8.xlsx')
ods8 = pd.DataFrame(ods8).fillna(0) #turns MV into 0
ods8ind = ods8.drop('ODS_08', axis=1)
Y = ods8['ODS_08'] #independent variable
def reg_proc(label):
X = ods8ind[label] #each dependent variable
regressor = LinearRegression()
regressor.fit(X, Y)
regressor.score(X, Y)
rsquared = regressor.score(X, Y)
return(rsquared)
rsquared_df = pd.DataFrame({ods8ind: reg_proc(ods8ind) for ind in ods8ind.columns},
columns = ods8ind.columns)