具有浮点数和整数的数组的随机森林评估 - numpy

时间:2017-03-06 17:23:30

标签: python arrays numpy random-forest

我有一个包含浮点数的特征值的数组,我有一个标签数组,它们是整数 - 1和0。

实施例: 特征值:

[[  17.99    10.38   122.8   ...,    0.147    0.242    0.079]
 [  20.57    17.77   132.9   ...,    0.07     0.181    0.057]]

当我将标签附加到特征值数组时,标签变为浮动。 示例 - 附加0的feature_values:

[[  17.99    10.38   122.8   ...,    0.242    0.079    0.   ]]

当我运行以下代码时:

training_set = data_features[:,0:9] 
test_set = data_features[:,9] 
seed = 7
num_trees = 100
max_features = 3
kfold = model_selection.KFold(n_splits=10, random_state=seed)
model = RandomForestClassifier(n_estimators=num_trees, max_features=max_features)
results = model_selection.cross_val_score(model, training_set, test_set, cv=kfold)
print(results.mean())

我收到错误:

raise ValueError("Unknown label type: %r" % y_type)

ValueError: Unknown label type: 'continuous'

根据我的阅读,我发现这种情况正在发生,因为标签是浮动的。

如果我将特征值的dtype更改为" int",代码确实有效,但我需要保留浮点数。

有没有办法让标签作为整数和特征值作为浮点数,以便代码有效?

1 个答案:

答案 0 :(得分:1)

你需要将y_labels转换为整数,以便RandomForestClassifier可以训练它。

test_set = data_features[:,9].astype(int)