想象一下,你在二维中有两个高斯概率分布。第一个以(0,1)为中心,第二个以(0,-1)为中心。 (为简单起见,假设它们具有相同的方差。)可以考虑从这两个高斯中采样的数据点簇是线性可分的吗?
直观地,很明显,将两个分布分开的边界是线性的,即在我们的例子中是横坐标。然而,线性可分性的形式要求是簇的凸包不重叠。高斯生成的聚类不是这种情况,因为它们的潜在概率分布遍及所有R ^ 2(尽管远离均值的概率可以忽略不计)。
那么,高斯生成的簇是否可以线性分离?如何协调凸壳的要求与直线是唯一可以想象的边界"?或者,一旦图像中出现非等方差,边界可能会有效地不再是线性的?
答案 0 :(得分:2)
根据定义,高斯聚类是无限的。它们几乎无处不在,只有不同的密度。
因此,它们不可分离,线性与否。 “可分离性”的概念在这里不起作用。
答案 1 :(得分:1)
高斯群集实例可能是可分的。这取决于结果,而不是产生它的过程。
线性可分性can be defined a,因为存在分隔两组点的平面,使得一组点完全位于平面的一侧,而另一组点完全位于另一侧这架飞机。
现在拿你的特定高斯分布。 可能它们生成了两个线性可分离的集合(在横坐标处或不在横坐标处)。但是,如果方差为非零,并且您让进程生成足够的点,则结果将不会线性分离。
所以,再一次,这是结果的问题,而不是过程的问题。