在RPN(Tensorflow Faster-RCNN)中显示预测的Boxex

时间:2019-11-01 17:30:24

标签: python tensorflow bounding-box rpn faster-rcnn

我一直在训练模型以识别图像上的字符。 我目前正在做的是尝试使用TensorFlow对象检测存储库中的预定义fast-rcnn来识别较小图像(700x50)中的字母。这些图像最多包含我要识别的13个字母,以及背景中不需要识别的一些较小的符号和字母。

我已经在TensorFlow模型Zoo的配置文件中使用python训练了一些采用模型的模型,并且训练的结果(分类精度和损失)很好。但是,框预测/区域建议对我不起作用。在图像上使用模型时,它总是在第一个或第一个和第二个字符上找到。模型根本找不到其他字符。我已经尝试过调整锚点参数和其他内容,但这对我的问题并不重要。

我现在的问题是:如何在模型中输出由区域提案(RPN)预测的框/锚点?我想了解如何更改模型以了解正在发生的事情以及为什么找不到其他字母-更不用说正确分类了。 但是要找出原因,即使我已经尝试更改许多选项(例如锚点大小或最大预测值),我也必须知道RPN在做什么才能理解为什么我的模型只找到前两个字母...

如果有人对如何在TensorFlow更快的RCNN模型中输出RPN的建议有一个神奇的答案,那么从那里我可以找出他们为什么不将其纳入最终结果的原因,那就太好了。 但是,我也很高兴获得有关如何从此处开始的提示-例如我自己建立一个RCNN,而不使用TensorFlow动物园或任何其他模型。由于我将在几个月内进一步研究该模型,因此,对如何更深入地创建更好的模型的任何提示都表示赞赏。

谢谢。

0 个答案:

没有答案