标签: python-2.7 machine-learning scikit-learn
] 1
我有一个数据集,我想从中预测患者患上这种疾病。下图是第一步:
当我查看这些数据时,我的第一反应是绿点(不易患肾病的人)不可分离。
我的假设是否正确?
答案 0 :(得分:1)
可能是您的PCA没有产生分离数据的最佳功能。我建议使用像Random Forest或XGBoost这样的东西,你可以很容易地看到特征重要性,然后使用最好的3个功能来尝试对数据进行分类。
答案 1 :(得分:0)
无法分开点。