我试图预测一个值。我能够预测何时使用我的真实目标值,这是几天,但我尝试使用该值的日志进行预测,它会给我一个错误。我使用sklearn
和随机森林。
代码:
X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1)
Y = final_pressure_df['log_y']
X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5)
forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5)
forest.fit(X_train, Y_train)
错误:ValueError: Unknown label type: array([[ 3.91202301]
有人能帮助我吗?
答案 0 :(得分:0)
您需要回归,而不是分类,因此请使用RandomForestRegressor
。
当预测的变量是实值(浮点数)时,分类将不起作用。即使在第一种情况下,当您预测天数时,使用回归仍然更有意义,因为您预测某个值,以及非类别/类别中的天数。