我正在尝试为以下功能训练LR模型(X_train)(50k示例):
day month year Rank CountryId
9 1 2013 1 18
10 1 2013 1 18
29 4 2009 1 6
7 6 2006 1 6
7 3 2007 1 6
14 12 2006 1 2
5 10 2011 1 6
...
[50000 rows x 5 columns]
和预测分数(y_train):
0.264498
0.264498
0.494186
0.033319
0.222304
0.013010
3.210939
....
当我尝试用它进行交叉验证时,它给了我非常糟糕的分数:
model = LinearRegression(copy_X=True, normalize=False, n_jobs=3)
scores = cross_validation.cross_val_score(model, X_train, y_train, cv=4)
print(scores)
[ 0.1782062 0.18358134 0.18338371 0.18420599]
我能想到的唯一可能是模型不合适,但这可能是其他原因?