我正在尝试使用PyTorch中的KAIST数据集来训练模型并生成权重。我是python和PyTorch的新手,我正在努力将数据加载器与此类数据集结合使用。数据集带有png图像文件,但注释(标签和边框)为.vbb格式,我无法转换为可用形式(即csv,文本文件等)。所以我想我的第一个问题是,我如何将注释转换为可以用其相关注释迭代png文件的格式。第二个问题是,如何在PyTorch中为此数据集创建数据加载器。
任何建议将不胜感激。
链接到数据集-https://github.com/SoonminHwang/rgbt-ped-detection/tree/master/data
有一种方法可以转换上面链接中提供的注释,但是我无法获取它以产生正确的结果。也许有更简单的方法可以通过python进行转换?