我想了解最近发布的object_detection模型是如何准备在Tensorflow中使用的,其长期目标是修改其中一个元架构。
是否有关于如何实现元架构(例如更快的R-CNN或SSD)或正在阅读代码的唯一方法的报道?特别是,我理解这些元架构是如何定义的(如相应的论文中所述),但我不明白它们是如何在Tensorflow中实现的。
即使是非常高级的概述,描述流在这种情况下(或与不相关的模型)的工作方式也非常有用。 (我知道短object_detection
docs和detection architecture guide,但事实并非如此。)
从Keras背景中查看这些object_detection
模型时,特别令人难以置信的是模型是使用相对较大的proto
和config
文件定义的,但评论很少,同时涉及非标准层。此外,从frozen_inference_graph.pb
和proto
文件获取培训中使用的config
文件的过程并不明显。
非常感谢任何信息或提示来源。
答案 0 :(得分:1)
我上周通过代码库获得了更快的R-CNN和SSD管道。我强烈建议您浏览代码库。功能/方法有很好的文档记录,如果你知道相应论文的细节,就可以很容易地理解。为了理解config
文件中的信息如何影响模型,我建议您浏览各种构建器(在构建器文件夹中)。如果您使用SSD模型进行培训,请检查model_builder.py
中的相应function。这是来自config的所有信息用于构造各种类的实例的地方。 model_builder.py
train()
函数会调用trainer.py
所以简单地回答你,作为一个星期前穿着你的人,我推荐的最佳方法是让你通过代码:)。