机器学习的回归,分类

时间:2014-12-11 00:23:13

标签: machine-learning classification linear-regression

我对机器学习有一个分类和回归问题。 第一个问题,以下数据集 http://it.tinypic.com/view.php?pic=oh3gj7&s=8#.VIjhRDGG_lF

我们可以说,数据集是线性可分的吗? 为了应用线性模型进行分类,此数据集不需要对输入空间进行变换,或者此数据集无法进行变换? 我的答案是否定的,但我不确定第二种,我不确定数据集是否可以进行转换。

关于回归问题的第二个问题: 给出以下数据集f:R - > [R http://it.tinypic.com/view.php?pic=madsmr&s=8#.VIjhVjGG_lE

我们可以这样说: 回归的线性模型可用于学习与此数据集相关的函数? 给定这个数据集,不可能确定线性模型的最佳配置?

我正在读Tom Mitchell机器学习,模式识别和机器学习主教的书,但我仍然无法给出正确的答案。 提前谢谢。

1 个答案:

答案 0 :(得分:1)

这两个数据集都不能使用线性分类/回归建模。

如果“输入数据转换”只有数据集是一致的(没有两个完全相同的点有两个不同的标签)总是存在转换,之后数据可以线性分离。特别是可以用以下方法构建它:

phi(x) = 1 iff label of x is "1"

换句话说,您将所有正样本映射到“1”,将负数映射到“0”,因此您的数据现在可以线性分离。或者简单地将你的N个点映射到R ^ N空间中的N个单位向量,使得我的点被映射到[0 0 0 ... 1 ... 0 0 0] ^ T,其中出现“1”在我的地方。对于任何标记,此类数据集都可以线性分离。