我想创建一个手写数字0和1(http://yann.lecun.com/exdb/mnist/)的散点图。我拿了4个样本,即两个0和两个1。
每个手写数字具有尺寸1跨越778矩阵的像素值。
现在我想在二维中做这些数字的散点图,以检查它们是否可分离。
我尝试在R中绘制那些,但最终的情节只是点数的混合。 我如何绘制每个数字的散点图看起来与其他数字不同的顺序。我在策划时是朝着正确的方向前进吗?
请告知。
答案 0 :(得分:2)
它们可能是可分离的,所以你真的不需要检查它。
如果您想知道它们是否可分离,正确的方法是使用SVM等分类器。
您正在尝试将4位数(4x778)中的reduce the dimensions分为两个维度(4x2)。有很多方法可以做到,没有一个是完美的。减小尺寸后,一些信息总是丢失,因此它只是一种判断高维数据是否可分离的近似方法。
将数据缩减为两个(或任意数量)维度的最常见/最简单的方法称为PCA。