所以我需要对一个螺旋数据集进行分类。我一直在试验一堆算法,比如 KNN、Kernel SVM 等。我想尝试使用特征工程、预处理等来提高 Logistic 回归的性能。
我也在用 scikit 学习做所有的分类。
我完全理解逻辑回归不是解决此类问题的正确算法。这更像是预处理和其他特征工程/提取方法的学习练习,以了解我可以在多大程度上改进此特定模型。
这是我将用于分类的示例数据集。关于如何操作数据集以用于逻辑回归算法的任何建议都会有所帮助。
我也有多个螺旋的数据集。一些数据集有 2 个类或有时多达 5 个。这意味着多达 5 个螺旋。
答案 0 :(得分:0)
由于数据似乎不是线性可分的,您可以尝试使用支持向量分类中常用的Kernel Trick方法。核函数接受原始低维空间中的输入,并返回高维空间中变换向量的点积。这意味着变换向量 ϕ(x) 只是相应低维向量 x 中坐标的某个函数。
答案 1 :(得分:0)