我目前正在尝试识别视频播放器的控件(例如“播放”,“暂停”,“快进”等)。 我从训练小型数据集(8个图像)开始,它们都非常相似,可以使模型过拟合,然后扩展数据集。 现在,我对某些类型的控件有了正确的认识,但并不是全部。问题是我无法调和的对象总是相同的!因此,问题是:我不知道与培训/认可有关的任何限制,限制,细微差别等吗?因为这不是对这项任务进行正确识别的第一次尝试:我尝试了大数据集,尝试了学习速度和动力,改变了标注策略-总是一样,一种特定类型的对象将被忽略!
我使用以下命令进行识别:
./flow --imgdir /tmp/test --model /root/darkflow/cfg/project.cfg --backup /root/darkflow/ckpt/project/ --load 21400 --labels /tmp/labels-project.txt
此内容用于培训:
./flow --train --labels /tmp/labels-project.txt --annotation $TMP_DATA/ann --dataset $TMP_DATA/img --model $DARKFLOW_HOME/cfg/$MODEL.cf$
--load 17400 --gpu 1.0 --lr 1e-8 --keep 100 --backup $DARKFLOW_HOME/ckpt/$MODEL/ --save 300 --epoch 4000 --verbalise > /tmp/train_$MODEL.log &
这是我无法识别的(黑色背景上的灰色(或蓝色)矩形中的CC)。大小可能有所不同: enter image description here