机器学习的新手,所以寻找一些方向如何开始。最终目标是能够训练模型以使用Tensorflow计算图像中的对象数量。我最初的重点是训练模型来计算一种特定类型的对象。所以我要说我拿硬币。我只会训练模型来计算硬币。不担心为所有不同类型的对象创建通用计数器。我只做了谷歌花卉图像分类的例子,我理解了它的基本知识。所以寻找线索如何开始。这是一个图像分类问题,我可以使用与花等相同的逻辑吗?
答案 0 :(得分:4)
硬币问题的最佳解决方案可能是使用回归来解决这个问题。使用场景中的对象数量注释5k图像并在其上运行模型。然后你的模型只输出正确的数字。 (希望)
另一种方法是分类图像是否显示硬币并使用像这样的滑动窗口方法:https://arxiv.org/pdf/1312.6229.pdf如果它显示硬币则对每个窗口进行分类。然后计算找到的区域。这个更易于注释和学习,更易于扩展。但是你有选择好窗口的问题,并以简洁的方式使用这些窗口的结果。