我正在关注the tutorial重新训练适应我自己问题的初始模型。 我在大约100个文件夹/类别中有大约5万张图像。
运行此
bazel build tensorflow/examples/image_retraining:retrain
bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir /path/to/root_folder_name
在Amazon EC2 g2.2xlarge上我希望整个过程非常快(比我的笔记本电脑更快),但瓶颈文件的创建需要很长时间。 假设已经有2个小时,只创建了800个文件,我需要超过5天(!!)来创建文件......
因为GPU,它应该比这个节奏更快(创建约400个瓶颈文件/小时)吗?
我怎样才能让这个过程更快?
答案 0 :(得分:1)
终于找到了我的问题的答案。
Bazel在没有GPU支持的情况下工作。为了解决这个问题,我修改了有关这些问题的文件:
然后跑
TF_UNOFFICIAL_SETTING=1 ./configure
bazel build -c opt --config=cuda tensorflow/examples/image_retraining:retrain --verbose_failures
bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/Images/
在一天结束时,这个过程要快得多(500张图像/秒),训练本身也是用GPU完成的!