阅读EMNIST数据集

时间:2018-06-16 18:40:07

标签: pandas tensorflow deep-learning computer-vision conv-neural-network

我在python中使用tensorflow构建CNN,但是从EMNIST数据集加载数据时遇到问题。任何人都可以给我一个示例代码,批量检索每个图像并在培训期间通过吗?

1 个答案:

答案 0 :(得分:0)

EMNIST数据集有两种格式...我发现最容易理解的是Kaggle上的CSV版本:https://www.kaggle.com/crawford/emnist,其中每一行都是单独的图像,共有785列其中第一列= class_label,后面的每一列代表一个像素值(对于28 x 28图像,总计为784)。

您可以使用Keras检出我对EMNIST CNN的一种实现,其中数据集的加载可以类似:

import pandas as pd

raw_data = pd.read_csv("data/emnist-balanced-train.csv")

train, validate = train_test_split(raw_data, test_size=0.1) # change this split however you want

x_train = train.values[:,1:]
y_train = train.values[:,0]

x_validate = validate.values[:,1:]
y_validate = validate.values[:,0]

来自https://github.com/Josh-Payne/cs230/blob/master/Alphanumeric-Augmented-CNN/augmented-cnn.py