如何创建char数据集,如minst_digits数据集

时间:2017-03-21 10:39:19

标签: machine-learning neural-network computer-vision conv-neural-network pattern-recognition

我有62000个字体图像(0-9,A-Z和a-z图像)数据集,其中单个字符有1000个图像。我创建了62000行图像标准化像素值和标签的csv文件。我不知道在训练,验证和测试数据集中提取这个csv文件,以便我可以获得更好的准确性。 enter image description here

1 个答案:

答案 0 :(得分:0)

您可以使用SciKit-Learn' train_test_split

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

X, y = your.data, your.target #input your own data here
train, test = train_test_split(X, test_size = 0.2, random_state=0)

另外,请阅读此sklearn tutorial