如何将(samesize,categoriezed)图像转换为TensorFlow

时间:2016-07-11 08:17:11

标签: machine-learning dataset tensorflow training-data mnist

我正在学习使用TensorFlow创建学习模型。

我已成功运行MNIST教程,现在想用我自己的图像测试模型。它们是相同尺寸的图像(224x224)并分类为文件夹。

现在我想将这些图像用作我的模型的输入,如在MNIST示例中那样。我试图打开MNIST数据集,但它不可读。我猜它已被转换成一些二进制类型。通过这个例子,我认为MNIST数据集有某种结构:

  • MNIST
    • 测试
      • 图像
      • 标签
    • 列车
      • 图像
      • 标签

如何使数据集看起来像我自己的图像文件中的MNIST数据?

非常感谢!

1 个答案:

答案 0 :(得分:3)

MNIST未以图像格式存储。从mnist网站(http://yann.lecun.com/exdb/mnist/)您可以看到它具有已经接近张量或numpy数组的特定格式,可以在tensorflow中使用最小的调整。它是一种带数字的矩阵。

使用常用图像(例如.jpg)需要使用任何python库进行图像处理以转换为np.array。例如PIL可以工作,就像这里: PIL and numpy

另一个选择是使用tensorflow中的内置函数将图像直接转换为tensofrlow支持的张量,请检查: https://www.tensorflow.org/versions/r0.9/api_docs/python/image.html