应用错误收集

在csv数据集上使用Scikit-learn

时间：2017-07-21 13:15:12

标签： python arrays scikit-learn

如何将scikit-learn应用于numpy数组，其中4列各自代表不同的属性？基本上，我想教它如何从这4个特征中识别健康的患者，然后看它是否能识别出异常的特征。

提前致谢！

2 个答案:

答案 0 :(得分：0)

查看pandas包，它允许您将CSV文件导入数据框。 pandas支持scikit-learn。

答案 1 :(得分：0)

管道通常包含以下步骤：

定义分类器/回归器

from sklearn import svm clf = svm.SVC(gamma=0.001, C=100.)

适合数据

clf.fit(X_train,y_train)

此处X_train将是您的四个列功能，y_train将成为患者健康的标签。

预测新数据

y_pred = clf.prdict(X_test)

This tutorial是您了解管道的基本想法的绝佳起点。