应用错误收集

创建数据集的最佳实践

时间：2020-06-22 20:02:06

标签： machine-learning deep-learning computer-vision

我想创建一个用于人体姿势识别的数据集，记录一组视频，然后从每个视频中提取一个帧，然后将每个帧按照相应的姿势分类。但是问题是，例如，对于站立姿势，我录制了3分钟的视频用于训练和验证集，每个姿势都录制了3分钟的视频用于验证，并为x姿势设置了训练集。我可以解决的问题，我将在训练和验证集中获得相同数量的示例（示例：1000个示例火车和1000 val），这会导致我遇到问题吗？

1 个答案:

答案 0 :(得分：0)

通常，当您对数据进行分类时，您将拥有比验证集更多的训练数据，就我而言，我通常希望将75％的数据作为训练，并将25％的数据用于验证。尽管就您而言，您的训练数据看起来足够大，以至于数据中的任何异常值都不会影响您的分类算法。只要训练集的大小足以足以训练您的算法并且不受异常值的影响，训练集的数据是否少于验证集也没关系。