Scikit-learn的文档说该函数有两个参数:X(数据)和y(目标值)。我们是否从数据中删除目标变量并将其分别作为y提供?还是我们将目标变量保留在X中,并且也将其分别作为y提供?我遇到过两种方法,并且想知道哪种方法正确。
答案 0 :(得分:3)
X
不应包含目标作为列之一。如果包含它,则线性模型将不会产生 coding 错误,但是要预测目标y
,它将仅使用特征y
。
答案 1 :(得分:1)
据我了解,您不应以明天的天气来预测明天的天气。如果您已经知道什么是正确的值,那么预测一个值是没有意义的。
但是,您也不需要在数据集中删除目标变量,只需将其不包括在X轴中即可。
我们要如何使用预测模型?根据过去的记录(x和y),我们训练了模型以查找它们之间的关系。将来,我们可能不再拥有y,但如果它们之间的关系不变,那么我们手中仍然有x,我们可以预测未来的y。