我有在我的工作场所使用的独特产品的图像。我无法想象初始数据库已经有类似的项目,它已被训练。
我尝试使用YOLO训练模型。这花了很长时间。也许在时代之间7分钟;由于数据量小,我想做1000个时代。
我在1.0 GPU上使用了tiny-yolov2-voc cfg / weight。我有一个项目的视频,但我把它分成了帧,所以我可以注释。然后我试图训练图像(不是视频)。这些产品与医疗相关。基本上是医院会使用的任何东西。
我还使用了从Google获得的图像的初始化方法。我注意到初始方法非常快并且导致准确的预测。但是,我担心我的图像太独特,无法开始工作。
最好使用哪种方法?
如果您推荐YOLO,请提供有关如何加快培训阶段的建议?
如果您推荐开始,请提供解释为什么它可以在独特的图像上工作?我想我无法理解如何在没有我提供注释的情况下知道我想要训练的项目。
提前致谢
答案 0 :(得分:1)
只是我的印象(没有推荐甚至相关经验)
查看与darknet
相关的Hardware recommendations假设是您可以储存自己的硬件以获得更快的结果。
我阅读了目前三个不同版本的YOLO
,并期望在下载推荐文件时包含很多GFLOPS培训,但如果这些模型永远不适合您的产品,那么对他们来说他们永远不会非常有帮助。登记/>
我必须承认我既没有使用YOLO
也没有使用Tensorflow
,所以我的印象可能根本没有帮助。
如果您看到YOLO
的一些视频,您可以注意到有时骆驼标有马并且准确性似乎很差,但这取决于应用于图像的阈值,因此视频看起来很神奇识别过快,但准确度越高,过程就越慢 - 这也取决于训练有素的动机
他们从不隐瞒它们,他们在一张图片上解释,其中一只狗被标记为牛,一匹马被称为绵羊(Version 2),与暗网相结合,它变得更快但不太准确,所以暗网的使用是一个重要的方面。
关于细节的信息在YOLO
的网站上看起来非常糟糕,它们更像是你用popstar做的,相比之下,Tensorflow
的网站看起来更具学术性并且正在通知数学框架背后
关于Tensorflow
我不知道硬件建议,但是当你写下你的结果很有用时,可能它们有点甚至更少。
我的印象是YOLO
主要用于(实时)视频中的实时检测,需要大量培训才能实现高精度。因此,根据您的使用情况,它可能是正确的,但您可能会投资硬件,可能是专业用途
这不是针对Tensorflow
的意见,而是我必须验证更多,似乎需要更多时间才能获得印象。关于Tensorflow
,我甚至不能说它是否可以用于实时检测,那么它的准确程度是多么准确,结果是否仍然比YOLO
更好。
我的假设是,对于这两种解决方案而言,这是一个涉及元素的问题(如决定是否包括暗网速度),配置,培训和调整。可能总有一些东西需要提高速度和准确性,因此投资一个识别系统不会是固定的时间线结束的静态过程,而是一个稳定的过程。
这只是对我的印象的简短概述,我从未体验过任何识别软件,也几乎不建议您根据我的话做出任何决定。
如果您想使用任何识别软件专业人员,特别是对于实时识别,那么您可能会投资硬件。
答案 1 :(得分:0)
根据我对您问题的理解,您需要具备识别独特图像的能力。在这种情况下,您可以在初始模型上使用 transfer-learning 。借助转移学习,您仍然可以在保持自己对先验知识的同时训练自己的照片。
有关transfer-learning的更多信息