Caffe预先编写训练数据

时间:2020-09-21 06:53:38

标签: caffe

我创建了图像和xml标签文件的数据集,其中图像的原始大小和分辨率比网络要处理的分辨率高得多。 (2700x900,网可处理500x130)。标签是边界框的minx,miny,maxx,maxy,作为原始图片的像素坐标。

<?xml version="1.0" ?>
<annotation>
    <folder>JPEGImages</folder>
    <filename>picture.jpg</filename>
    <size>
        <width>2700</width>
        <height>900</height>
        <depth>3</depth>
    </size>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>1622</xmin>
            <ymin>331</ymin>
            <xmax>1692</xmax>
            <ymax>415</ymax>
        </bndbox>
    </object>
</annotation>

现在,我想在训练网络之前对此数据集执行转换。例如重新缩放。我该怎么办?

我注意到create_data.sh脚本会自动重新缩放,但是它如何处理边界框的位置?

如果要删除平均值或更改颜色布局(RGB-> BGR)或进行直方图均衡怎么办?我应该在哪里添加这些?

0 个答案:

没有答案
相关问题