如何将EMNIST数据加载到Tensorflow

时间:2017-12-17 10:02:20

标签: image-processing tensorflow tensorflow-datasets

在我看过的所有关于tensorflow的教程中,他们使用了MNIST数据集,我已经理解了建模,但是我如何将这个数据集加载到张量流中? https://www.nist.gov/itl/iad/image-group/emnist-dataset

3 个答案:

答案 0 :(得分:2)

EMNIST dataset使用与原始MNIST dataset相同的二进制格式。因此,您可以从使用原始MNIST数据集的任何教程中获取输入管道代码,并将其指向从下载EMNIST数据集以在该数据集上进行训练所获得的文件集。

答案 1 :(得分:0)

您可以使用scipy.io.loadmat()以Matlab格式加载EMNIST数据文件。加载后必须旋转阵列。 GitHub上有一个Jupyter Notebook,它有EMNIST Digits classification

答案 2 :(得分:0)

您可以使用可在此处找到的 EMNIST 软件包:https://pypi.org/project/emnist/

要加载数据集,您首先需要决定要使用六个不同数据集中的哪一个。本文中的详细信息:https://arxiv.org/pdf/1702.05373v1.pdf

假设我们要使用 byclass 数据集:

from emnist import extract_training_samples, extract_test_samples
x_train, y_train = extract_training_samples('byclass')
x_test, y_test = extract_test_samples('byclass')