如何格式化数据集以进行Python培训?

时间:2017-07-06 15:28:18

标签: python dataset keras

如何格式化数据集以进行Python培训?

我有一些手写数字的3000个灰度BMP图像(就像MNIST一样)。现在我想用这个数据集训练我的模型(我正在使用Keras库),我正在使用卷积神经网络进行训练。

我正在使用此代码将其中一个图像转换为数组

`import numpy
from PIL import Image
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
img = Image.open(open('CMATERdb 3.3.1\Ad02599.bmp')).convert("L")
print(img.format, img.size, img.mode)
img = numpy.asarray(img) / 255.
imgplot = plt.imshow(img)`

,代码的结果是

无(32,32)L

image from the 3000 image want to convert into dataset

任何帮助我如何转换所有图像并将它们放在相同的MNIST数据格式中,我们将非常感激。

1 个答案:

答案 0 :(得分:2)

您可以使用任何将图像文件加载到数组中的库,例如Pillow

阅读Pillow的文档,了解如何将图像文件加载到数组中。

然后,您通常应该将数组缩放到0到1之间的值。通常,您只需将图像数组除以255(因为它们是0到255之间的RGB值)。

确保最终形成如下形状的阵列:(3000,宽度,高度,通道),其中通道通常为3(红色,绿色,蓝色)。