Question

我有62000个字体图像（0-9，A-Z和a-z图像）数据集，其中单个字符有1000个图像。我创建了62000行图像标准化像素值和标签的csv文件。我不知道在训练，验证和测试数据集中提取这个csv文件，以便我可以获得更好的准确性。 enter image description here

Answer 1

您可以使用SciKit-Learn＆＃39; train_test_split。

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

X, y = your.data, your.target #input your own data here
train, test = train_test_split(X, test_size = 0.2, random_state=0)

另外，请阅读此sklearn tutorial

如何创建char数据集，如minst_digits数据集

1 个答案: