如何将scikit-learn
应用于numpy
数组,其中4列各自代表不同的属性?
基本上,我想教它如何从这4个特征中识别健康的患者,然后看它是否能识别出异常的特征。
提前致谢!
答案 0 :(得分:0)
查看pandas
包,它允许您将CSV文件导入数据框。 pandas
支持scikit-learn
。
答案 1 :(得分:0)
管道通常包含以下步骤:
from sklearn import svm
clf = svm.SVC(gamma=0.001, C=100.)
clf.fit(X_train,y_train)
此处X_train将是您的四个列功能,y_train将成为患者健康的标签。
y_pred = clf.prdict(X_test)
This tutorial是您了解管道的基本想法的绝佳起点。