在随机森林Python中使用日志时出错

时间:2017-03-17 17:52:39

标签: python random-forest

我试图预测一个值。我能够预测何时使用我的真实目标值,这是几天,但我尝试使用该值的日志进行预测,它会给我一个错误。我使用sklearn和随机森林。

代码:

X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1)
Y = final_pressure_df['log_y']

X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5)

forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5)

forest.fit(X_train, Y_train)

错误:ValueError: Unknown label type: array([[ 3.91202301]

有人能帮助我吗?

1 个答案:

答案 0 :(得分:0)

您需要回归,而不是分类,因此请使用RandomForestRegressor。 当预测的变量是实值(浮点数)时,分类将不起作用。即使在第一种情况下,当您预测天数时,使用回归仍然更有意义,因为您预测某个值,以及非类别/类别中的天数。