数据框说明:
我有一个如下所示的数据框,“ TPAPC”和“ TPPPC”是特征,“ value”是Y的值。每101行是一个样本,而101 * 21行(意味着有21个样本) )。我的目的是使用sklearn学习多元线性回归模型。
尝试过:
我在互联网和书籍上看到了一些例子。示例的样本是1行的1个样本,其中包括图像数据的处理,还将高维图像数据展开为一维。
在我的问题上,如果它展开,它将使特征变为101 * 2,并且运行线性回归将不可避免地产生高维灾难,因为在此实验中我只有21个样本。在机器学习课程的学习过程中, Xi 是作为示例的列向量,因此我的数据帧也根据此要求进行了标准化。
问题
那么,我误会了吗,还是sklearn有我找不到的相关方法?