在csv数据集上使用Scikit-learn

时间:2017-07-21 13:15:12

标签: python arrays scikit-learn

如何将scikit-learn应用于numpy数组,其中4列各自代表不同的属性? 基本上,我想教它如何从这4个特征中识别健康的患者,然后看它是否能识别出异常的特征。

提前致谢!

2 个答案:

答案 0 :(得分:0)

查看pandas包,它允许您将CSV文件导入数据框。 pandas支持scikit-learn

答案 1 :(得分:0)

管道通常包含以下步骤:

  1. 定义分类器/回归器
  2. from sklearn import svm clf = svm.SVC(gamma=0.001, C=100.)

    1. 适合数据
    2. clf.fit(X_train,y_train)

      此处X_train将是您的四个列功能,y_train将成为患者健康的标签。

      1. 预测新数据
      2. y_pred = clf.prdict(X_test)

        This tutorial是您了解管道的基本想法的绝佳起点。