使用CNTK进行物体检测

时间:2017-04-03 17:14:33

标签: object-detection cntk resnet

我是CNTK的新手。 我想使用CNTK - ResNet / Fast-R CNN训练一组图像(以检测酒精玻璃/瓶子等物体)。

我正在尝试从GitHub中获取以下文档;但是,它似乎不是一个简单的程序。 https://github.com/Microsoft/CNTK/wiki/Object-Detection-using-Fast-R-CNN

我无法找到适当的文档来为不同大小和形状的图像生成投资回报率。以及如何根据训练模型创建对象标签?有人可以指出我可以使用cntk模型的正确文档或培训链接吗?请参阅附图,其中我可以使用脚本中的默认ROI加载示例图像。如何正确设置图像中的对象大小和标签?提前谢谢!

sample image loaded for training

2 个答案:

答案 0 :(得分:0)

不确定您的正确文档是什么意思。这是本文的实现(https://arxiv.org/pdf/1504.08083.pdf)。看起来你正试图产生投资回报率。您是否可以查看站点中记录的辅助函数来解析您可能需要的内容:

要运行玩具示例,请确保在PARAMETERS.py中将datasetName设置为“grocery”。

  • 运行A1_GenerateInputROIs.py以生成用于培训和测试的输入ROI。

  • 运行A2_RunCntk_py3.py以使用CNTK Python API训练快速R-CNN模型并计算测试结果。

算法将在几个候选区域上工作,然后生成输出:一个用于对象类,另一个用于生成属于这些类的对象的边界框。请参阅代码以获取实施的详细信息。

答案 1 :(得分:0)

  

有人可以指出我可以在cntk模型上使用的正确文档或培训链接吗?

您可以查看my repository on GitHub

它将指导您完成训练自己的模型进行物体检测和CNTK分类所需的所有步骤。

但简而言之,正确的步骤应该是这样的:

  1. 设置环境
  2. 准备数据
  3. 标记图像(基本事实)
  4. 下载预训练模型并为自定义数据集创建映射
  5. 运行培训
  6. 评估测试集上的模型