我尝试在预训练的初始模型之上重新训练(新图像,新类),因此我遵循了初始自述文件的说明: https://github.com/tensorflow/models/tree/master/inception#how-to-construct-a-new-dataset-for-retraining
我使用 bazel 成功构建并运行 build_image_data ,如教程中所述。之后我使用 bazel 成功构建了 inception_train :
~/tensorflowmodels/models/inception# bazel build inception/inception_train
INFO: Found 1 target...
Target //inception:inception_train up-to-date (nothing to build)
INFO: Elapsed time: 0.073s, Critical Path: 0.00s
然而,运行bazel-bin / inception / inception_train我总是得到以下内容:
~/tensorflowmodels/models/inception# bazel-bin/inception/inception_train --train_dir="/" --validation_dir="/" --data_dir="/images_jpg/" --pretrained_model_checkpoint_path="/tensorflowmodels/models/inception/inception-v3/" --fine_tune=True --initial_learning_rate=0.001 --input_queue_memory_factor=1 --num_gpus=1
-bash: bazel-bin/inception/inception_train: No such file or directory
当然,我会说99.9999%的概率是一个错字。所以我试着用python运行inception_train.py。我不得不改变一些导入位置,最后运行参数。但是,在CUDA驱动程序初始化后,脚本会停止,而不会显示任何错误消息。
非常感谢任何有关如何解决此问题的帮助(或在开始时进行微调/再训练)。
顺便说一下,我已经把它作为一个Github问题发布了(已经关闭,因为Stack Overflow会更多)。