我正在尝试将对象检测模型应用于包括约180张图像和相同数量的xml文件的数据集,每个图像的边界框坐标。 问题在于所有图像的大小都不同,但是在将它们放入模型之前,它们的大小都应该相同。如果我只是调整图像大小,则边框的所有坐标都将变得不正确,因此也应对其进行更新。
一种解决方案是调整图像大小,然后手动更新每个xml文件,但最好有其他解决方案。
答案 0 :(得分:0)
要调整边界框坐标的大小,可以使用以下逻辑:
如果原始图像尺寸为(width_orig,height_orig),调整后的图像尺寸为(width_new,height_new),并且初始边界框坐标为x_min,y_min,x_max,y_max
,则新边界框坐标将为x_min*x_scale,y_min*y_scale,x_max*x_scale,y_max*y_scale
,其中{{ 1}}
x_scale = width_new/width_orig
希望,如果最终需要使用csv格式的注释,则可以使用此xml_to_csv转换器将xml文件转换为csv,然后适当地读取和修改csv文件中的行。
希望这会有所帮助!