应用错误收集

表示用于识别的图像数据

时间：2017-02-05 06:11:09

标签： image-processing machine-learning

所以我正在研究一个学校项目，我们要做的是教一个神经网络来识别非建筑物的建筑物。我现在遇到的问题是在表单中表示数据，分类器函数可以“读取”。

训练数据是一堆图片+ .wkt文件，其中包含图片上建筑物的坐标。到目前为止，我们已经能够重新调整多边形，但有点卡在那里。

您能否提供任何关于如何将这一切以适当的形式提出的提示或想法？

修改：我不需要为我编写的代码，指向类似主题或图书的文章的链接更多是我正在寻找的内容。

1 个答案:

答案 0 :(得分：0)

你没有提到你正在使用的框架，但我会给出一个caffe的答案。

您的问题非常接近于检测图像中的对象。你有完整的图像与对象（在你的情况下建立）边界框。

最简单的方法是通过python数据层读取图像和存储该图像坐标的文件，然后将其输入网络。有关如何使用它的教程可以在这里找到：https://github.com/NVIDIA/DIGITS/tree/master/examples/python-layer 要加速该过程，您可能希望在自定义lmdb数据库中存储图像，坐标对。

最后，可以在Faster-RCNN库中找到一个完整的caffe实现的良好工作示例：https://github.com/rbgirshick/caffe-fast-rcnn/ 您应该检查自定义caffe分支中的roi_pooling_layer.cpp和roi_data_layer，了解数据如何输入网络。