创建数据集的最佳实践

时间:2020-06-22 20:02:06

标签: machine-learning deep-learning computer-vision

我想创建一个用于人体姿势识别的数据集,记录一组视频,然后从每个视频中提取一个帧,然后将每个帧按照相应的姿势分类。但是问题是,例如,对于站立姿势,我录制了3分钟的视频用于训练和验证集,每个姿势都录制了3分钟的视频用于验证,并为x姿势设置了训练集。我可以解决的问题,我将在训练和验证集中获得相同数量的示例(示例:1000个示例火车和1000 val),这会导致我遇到问题吗?

1 个答案:

答案 0 :(得分:0)

通常,当您对数据进行分类时,您将拥有比验证集更多的训练数据,就我而言,我通常希望将75%的数据作为训练,并将25%的数据用于验证。尽管就您而言,您的训练数据看起来足够大,以至于数据中的任何异常值都不会影响您的分类算法。只要训练集的大小足以足以训练您的算法并且不受异常值的影响,训练集的数据是否少于验证集也没关系。