我正在做一些基于颜色分类图像的实验。我有一个9000个鞋子图像的数据集,分为9种颜色,每种颜色1000张图像。
我按照TensorFlow的How to Retrain Inception's Final Layer for New Categories教程获得了58.3%的准确度。
然后我用SVC(RBF)分类器替换最后一层,准确率为65.4%。
有些错误是值得商榷的。例如,此图片的真实标签为Brown
,但我的分类符称其为Beige
:
但其他错误只是错误。此图片的真实标签为Pink
,但我的分类器显示为Blue
:
我怎样才能提高准确度?更多图片从头开始训练Inception网络?使用“标准”ML而非深度学习?
答案 0 :(得分:1)
Inception是一个NN模型,用于根据图像中的项目将图像分配给某个预定义的类。它依赖于许多池/卷积层来完成工作,并建立从较低级别(边缘)到较高级别(眼睛)的功能。
尽管如此,它是一个复杂而强大的模型,它不能做任何事情。再培训仅适用于类似的任务(如分类不同类型的汽车,区分狗/猫或花)。你不能问它是吃还是喝,要加两个数字。
问问自己,如果你想学习鞋子的颜色,知道边缘是否是最好的选择。很可能没有,但每种颜色在此图像中出现的次数可能更重要。
所以我会尝试清理图像,只让鞋子居中,然后尝试逻辑回归。