我正在尝试预测用户执行点击的意图。因此,我在Python中使用sklearn库尝试了两种方法来处理RandomForest和LinearRegression。
回归:
from sklearn import linear_model
linreg = linear_model.LinearRegression()
linreg.fit(X_train, y_train)
RandomForest:
from sklearn import ensemble
forest = ensemble.RandomForestRegressor()
forest.fit(X_train, y_train)
回归输出:
RandomForest的输出:
如您所见,两个模型的相同特征集和相同数据结果非常不同。而且,两个模型中每个特征集的重要性不同,它们的相对重要性也不同。那么,有人可以解释这种行为吗?在我看来,回归在将零与非零分开方面做得很好,对吧?