具有tensorflow / models / object_detection

时间:2017-07-14 03:46:23

标签: tensorflow classification feature-extraction object-detection

如果我想在用于对象检测的特征金字塔网络中实现k = k0 + log2(√(w * h)/ 224),我应该在哪里和哪个文件中更改?

注意,此公式适用于ROI池。 W和H是ROI的宽度和高度,而k表示应该使用此ROI的特征金字塔的级别。

*说object_detection中的FasterRCNN meta_architecture文件可能会有所帮助,但请告诉我哪种方法可以更改。

2 个答案:

答案 0 :(得分:1)

请查看this document,了解该过程的概述。简而言之,您必须为所需的元架构创建一个“FeatureExtractor”子类。对于FasterRCNN,您可以从Resnet101 Feature Extractor的副本开始作为起点。

答案 1 :(得分:1)

简短的回答是,改变不会是微不足道的,因为我们目前不支持多层裁剪区域。以下是如果您想要追求这一点需要改变的概述:

  • 生成新的锚点集 目前更快的RCNN使用“GridAnchorGenerator”作为first_stage_anchor_generator - 而您必须使用MultipleGridAnchorGenerator(与我们在SSD管道中使用的相同)。
  • 您必须使用32 ^ 2锚箱 - >对于锚点生成器的scale字段,基本上你必须添加.125
  • 您必须修改代码以从多个层生成和裁剪:要开始,请在名为“_extract_rpn_feature_maps”的faster_rcnn_meta_arch文件中查找一个函数,该文件具有提示性名称,但目前只返回一个张量!您还必须添加一些逻辑,以根据提案的大小确定要裁剪的图层(文章中的公式1)
  • 您必须在Derek链接到的directions之后最终创建一个新的特征提取器。