我有62000个字体图像(0-9,A-Z和a-z图像)数据集,其中单个字符有1000个图像。我创建了62000行图像标准化像素值和标签的csv文件。我不知道在训练,验证和测试数据集中提取这个csv文件,以便我可以获得更好的准确性。 enter image description here
答案 0 :(得分:0)
您可以使用SciKit-Learn' train_test_split
。
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
X, y = your.data, your.target #input your own data here
train, test = train_test_split(X, test_size = 0.2, random_state=0)
另外,请阅读此sklearn tutorial