此问题是this one的扩展名。
TLDR; 我正在尝试使用自己的数据集训练TS Object Detection API。为了证明概念,我决定将我的数据集粘贴到Pascal VOC 2012基准测试中。
目前,我正在尝试使用Pascal VOC注释创建TFRecord。
在 create_pascal_tf_record.py 脚本中查看this line,他们只是抓住飞机的描述符;一个更好的词,文本文件的运气。为什么会这样?那些其他类的描述符怎么样?
旁注
此文件;标题为 aeroplane_train.txt ,与VOC2012 / ImageSets / Main /中的Pascal VOC 2012 dataset一起被包括在内。
查看文件,第一个条目代表图像名称,-1或1表示该特定图像是否包含我们感兴趣的类(飞机)。
aeroplane_train.txt 文件的部分内容
2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033 1
2008_000036 -1
2008_000037 1
2008_000041 -1
2008_000045 -1
2008_000053 -1
2008_000060 -1
2008_000066 -1
2008_000070 -1
2008_000074 -1
2008_000085 -1
2008_000089 -1
2008_000093 -1
2008_000095 -1
2008_000096 -1
2008_000097 -1
2008_000099 -1
2008_000103 -1
2008_000105 -1
2008_000109 -1
2008_000112 -1
2008_000128 -1
2008_000131 -1
2008_000132 -1
2008_000141 -1
答案 0 :(得分:6)
我回答了类似的问题here。最重要的是,我们目前只查看aeroplane_train.txt文件的第一列(与其他xxx_train.txt文件相同),并让我们找出训练集中每个图像的路径。