Question

我对机器学习有一个分类和回归问题。第一个问题，以下数据集 http://it.tinypic.com/view.php?pic=oh3gj7&s=8#.VIjhRDGG_lF

我们可以说，数据集是线性可分的吗？为了应用线性模型进行分类，此数据集不需要对输入空间进行变换，或者此数据集无法进行变换？我的答案是否定的，但我不确定第二种，我不确定数据集是否可以进行转换。

关于回归问题的第二个问题：给出以下数据集f：R - ＆gt; [R http://it.tinypic.com/view.php?pic=madsmr&s=8#.VIjhVjGG_lE

我们可以这样说：回归的线性模型可用于学习与此数据集相关的函数？给定这个数据集，不可能确定线性模型的最佳配置？

我正在读Tom Mitchell机器学习，模式识别和机器学习主教的书，但我仍然无法给出正确的答案。提前谢谢。

Answer 1

这两个数据集都不能使用线性分类/回归建模。

如果“输入数据转换”只有数据集是一致的（没有两个完全相同的点有两个不同的标签）总是存在转换，之后数据可以线性分离。特别是可以用以下方法构建它：

phi(x) = 1 iff label of x is "1"

换句话说，您将所有正样本映射到“1”，将负数映射到“0”，因此您的数据现在可以线性分离。或者简单地将你的N个点映射到R ^ N空间中的N个单位向量，使得我的点被映射到[0 0 0 ... 1 ... 0 0 0] ^ T，其中出现“1”在我的地方。对于任何标记，此类数据集都可以线性分离。