我有一堆图像(~3000)已根据某些商业标准进行了人工分类(批准/拒绝)。我使用Google Cloud Platform处理这些图片,例如获取注释和安全搜索结果(csv格式):
文件名;批准/拒绝;成人;欺骗;医疗;暴力;注释 A.JPG;批准; VERY_UNLIKELY; VERY_UNLIKELY; VERY_UNLIKELY;可能性很小;船| 0.9,车辆| 0.8 B.JPG;拒绝; VERY_UNLIKELY; VERY_UNLIKELY; VERY_UNLIKELY;可能性很小;文本| 0.9,字体| 0.8
我想使用机器学习来预测新图像是应该被批准还是被拒绝(csv文件中的第二列)。
我应该使用哪种算法?
我应该如何格式化数据,尤其是注释列?我应该首先获得所有可用的注释类型,并将它们用作具有数值的特征(如果它不适用,则为0)?或者将注释列作为文本处理会更好吗?
答案 0 :(得分:1)
我建议你尝试卷积神经网络。
测试你的想法的最快方法是否可行(问题可能是你拥有的图像数量很少),就是使用Tensorflow的转移学习。 Magnus Erik Hvass Pedersen提供了很棒的教程,他们在youtube上发表了这些教程。
我建议你浏览所有视频,但重要的是#7和#8。
使用转移学习可以让您使用他们在谷歌构建的模型来分类图像。但是通过转移学习,您可以将自己的数据与自己的标签一起使用。
使用这种方法,您将能够看到这是否适合您的问题。然后,您可以深入了解卷积神经网络,并创建最适合您的问题的管道。