如何在数据框中创建一列,该数据框根据另一列中的值计算cross_val_score

时间:2019-11-13 19:09:26

标签: python pandas dataframe linear-regression k-fold

我用两列创建了一个DataFramedf_kfolds):kfoldsMean_Score,其中Kfolds的范围是3到5。尝试计算从以下得出的每个kfold的mean_score

cross_val_score(lr, X, y, cv=3, error_score = 1).mean()

其中:

lr = LinearRegression()
X are the feature variables
y is the target
cv = # of kfolds

我知道您可以基于简单的数学计算来创建带有来自另一列的值的列,但是不确定是否可以使用统计函数。这是我的代码:

df_kfolds['Mean_Score'] = cross_val_score(lr, X, y, cv=(df_kfolds['kfolds']), error_score = 1).mean()

引发此错误:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

谢谢您的帮助!

0 个答案:

没有答案