我有一个包含浮点数的特征值的数组,我有一个标签数组,它们是整数 - 1和0。
实施例: 特征值:
[[ 17.99 10.38 122.8 ..., 0.147 0.242 0.079]
[ 20.57 17.77 132.9 ..., 0.07 0.181 0.057]]
当我将标签附加到特征值数组时,标签变为浮动。 示例 - 附加0的feature_values:
[[ 17.99 10.38 122.8 ..., 0.242 0.079 0. ]]
当我运行以下代码时:
training_set = data_features[:,0:9]
test_set = data_features[:,9]
seed = 7
num_trees = 100
max_features = 3
kfold = model_selection.KFold(n_splits=10, random_state=seed)
model = RandomForestClassifier(n_estimators=num_trees, max_features=max_features)
results = model_selection.cross_val_score(model, training_set, test_set, cv=kfold)
print(results.mean())
我收到错误:
raise ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'continuous'
根据我的阅读,我发现这种情况正在发生,因为标签是浮动的。
如果我将特征值的dtype更改为" int",代码确实有效,但我需要保留浮点数。
有没有办法让标签作为整数和特征值作为浮点数,以便代码有效?
答案 0 :(得分:1)
你需要将y_labels转换为整数,以便RandomForestClassifier可以训练它。
test_set = data_features[:,9].astype(int)