手写数字的散点图

时间:2012-01-20 20:52:05

标签: machine-learning scatter-plot mnist dimensionality-reduction

我想创建一个手写数字0和1(http://yann.lecun.com/exdb/mnist/)的散点图。我拿了4个样本,即两个0和两个1。

每个手写数字具有尺寸1跨越778矩阵的像素值。

现在我想在二维中做这些数字的散点图,以检查它们是否可分离。

我尝试在R中绘制那些,但最终的情节只是点数的混合。 我如何绘制每个数字的散点图看起来与其他数字不同的顺序。我在策划时是朝着正确的方向前进吗?

请告知。

1 个答案:

答案 0 :(得分:2)

  1. 它们可能是可分离的,所以你真的不需要检查它。

  2. 如果您想知道它们是否可分离,正确的方法是使用SVM等分类器。

    您正在尝试将4位数(4x778)中的reduce the dimensions分为两个维度(4x2)。有很多方法可以做到,没有一个是完美的。减小尺寸后,一些信息总是丢失,因此它只是一种判断高维数据是否可分离的近似方法。

    将数据缩减为两个(或任意数量)维度的最常见/最简单的方法称为PCA