绿点是否可分?

时间:2017-04-12 07:37:42

标签: python-2.7 machine-learning scikit-learn

![Kidney Disease after doing a PCA] 1

我有一个数据集,我想从中预测患者患上这种疾病。下图是第一步:

  1. 缩放3个功能
  2. 运行scikit learn的PCA例程
  3. 原始数据集有25个功能但是对于我们的练习,我们被要求仅使用3个功能。然后将这3个特征减少到2到PCA
  4. 当我查看这些数据时,我的第一反应是绿点(不易患肾病的人)不可分离。

    我的假设是否正确?

2 个答案:

答案 0 :(得分:1)

可能是您的PCA没有产生分离数据的最佳功能。我建议使用像Random Forest或XGBoost这样的东西,你可以很容易地看到特征重要性,然后使用最好的3个功能来尝试对数据进行分类。

答案 1 :(得分:0)

无法分开点。