有没有办法在TensorFlow中读取数据以进行对象检测(例如类似于caffe' s WindowDataLayer
)?我试过四处寻找可以做到这一点的例子,但还没找到。
答案 0 :(得分:3)
TensorFlow使用的标准数据格式是Example
protocol buffer,它具有“功能”的通用概念,应该支持Caffe风格的WindowData
。 documentation包含有关此格式的一些信息,源代码包含example application,用于将图像数据(简单的MNIST格式)转换为此格式,以便与标准输入管道一起使用。
如果您按照这些步骤操作,您很可能将图像存储为“字节”功能,并添加密集的整数特征,对应于窗口和标签的坐标。
答案 1 :(得分:1)
过去几周我一直在使用TensorFlow进行对象检测,并将我的一些代码发布为TensorBox。输入格式是IDL格式的文本文件(例如,请参阅here),其中包含图像名称列表和每个图像中的边界框列表。您可以切换这些输入文件以训练和测试您自己的图像。
答案 2 :(得分:0)
查看file中的以下smallcorgi's github repository,它在tensorflow github存储库中实现了更快的RCNN架构。该文件是如何使用边界框注释读取PASCAL VOC格式的xml文件的示例。