尝试自定义使用40x40px图像训练MobilenetV2-训练后结果错误

时间:2020-07-19 10:39:11

标签: tensorflow machine-learning tf-slim mobilenet

我需要将小图像分类为4种不同类别,+ 1种“背景”用于虚假检测。

训练时,损失迅速降至0.7,但即使经过80万步也仍保持在0.7。最后,冻结的图似乎可以用背景标签对大多数图像进行分类。

我可能缺少一些内容,下面将详细说明我使用的步骤,欢迎任何反馈。 我是tf-slim的新手,所以这可能是一个明显的错误,也许样本太少了?我不是在寻找最高的准确性,只是在为原型工作。

原始资料可以在以下位置找到:https://www.dropbox.com/s/k55xoygdzb2efag/TilesDataset.zip?dl=0

我在Windows 10上使用了tensorflow-gpu 1.15.3。


  • 我使用以下方法创建了数据集: python ./createTfRecords.py --tfrecord_filename=tilesV2_40 --dataset_dir=.\tilesV2\Tiles_40

  • 我根据花朵提供者在models-master \ research \ slim \ datasets中添加了一个数据集提供者。

  • 我在models-master \ research \ slim \ nets \ mobilenet中修改了mobilnet_v2.py,更改了 num_classes = 5 mobilenet.default_image_size = 40 < / p>

  • 我通过python ./models-master/research/slim/train_image_classifier.py --model_name "mobilenet_v2" --learning_rate 0.045 --preprocessing_name "inception_v2" --label_smoothing 0.1 --moving_average_decay 0.9999 --batch_size 96 --learning_rate_decay_factor 0.98 --num_epochs_per_decay 2.5 --train_dir ./weight --dataset_name Tiles_40 --dataset_dir .\tilesV2\Tiles_40

    训练了网络
  • 当我尝试python .\models-master\research\slim\eval_image_classifier.py --alsologtostderr --checkpoint_path ./weight/model.ckpt-XXX --dataset_dir ./tilesV2/Tiles_40 --dataset_name Tiles_40 --dataset_split_name validation --model_name mobilenet_v2时,我会得到eval/Recall_5[1]eval/Accuracy[1]

  • 然后我用python .\models-master\research\slim\export_inference_graph.py --alsologtostderr --model_name mobilenet_v2 --image_size 40 --output_file .\export\output.pb --dataset_name Tiles_40

    导出图形
  • 并用freeze_graph --input_graph .\export\output.pb --input_checkpoint .\weight\model.ckpt-XXX --input_binary true --output_graph .\export\frozen.pb --output_node_names MobilenetV2/Predictions/Reshape_1

    将其冻结
  • 然后,我使用python .\label_image.py --graph .\export\frozen.pb --labels .\tilesV2\Tiles_40\labels.txt --image .\tilesV2\Tiles_40\photos\lac\1_1.png --input_layer input --output_layer MobilenetV2/Predictions/Reshape_1用来自数据集的图像尝试网络。 这是我得到错误分类的地方。, 像0:background 0.92839915 2:lac 0.020171663 1:house 0.019106707 3:road 0.01677236 4:start 0.0155500565一样用于数据集的“ lac”图像


我尝试更改depth_multiplier,学习速率,在cpu上进行学习,并从学习命令中删除了--preprocessing_name "inception_v2"。我没有任何想法...

1 个答案:

答案 0 :(得分:1)

改变学习率,也许从通常选择的3e-5开始。