Question

我创建了图像和xml标签文件的数据集，其中图像的原始大小和分辨率比网络要处理的分辨率高得多。（2700x900，网可处理500x130）。标签是边界框的minx，miny，maxx，maxy，作为原始图片的像素坐标。

<?xml version="1.0" ?>
<annotation>
    <folder>JPEGImages</folder>
    <filename>picture.jpg</filename>
    <size>
        <width>2700</width>
        <height>900</height>
        <depth>3</depth>
    </size>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>1622</xmin>
            <ymin>331</ymin>
            <xmax>1692</xmax>
            <ymax>415</ymax>
        </bndbox>
    </object>
</annotation>

现在，我想在训练网络之前对此数据集执行转换。例如重新缩放。我该怎么办？

我注意到create_data.sh脚本会自动重新缩放，但是它如何处理边界框的位置？

如果要删除平均值或更改颜色布局（RGB-> BGR）或进行直方图均衡怎么办？我应该在哪里添加这些？

Caffe预先编写训练数据

0 个答案: