如何在Floydhub中指定模型目录?

时间:2017-12-22 20:58:08

标签: tensorflow nlp deep-learning

我是Floydhub的新手。我正在尝试运行this github repository中的代码和相应的教程。

对于培训,我成功使用了这个命令:

random

我在培训文件中调整了这一行,以便在Floydhub中工作:

 floyd run --gpu --env tensorflow-1.2 --data janinanu/dataset 
 /data/2:tut_train 'python udc_train.py'

如上所述,这对训练没有任何问题。

现在进行测试,我并没有真正找到有关如何指定存储训练输出的模型目录的任何细节。我使用model_dir作为挂载点来训练输出。我假设正确的命令看起来像这样:

tf.flags.DEFINE_string("input_dir", "/tut_train", "Directory containing 
input data files 'train.tfrecords' and 'validation.tfrecords'")

我不知道在floyd run --cpu --env tensorflow-1.2 --data janinanu/datasets /data/2:tut_test --data janinanu/projects/retrieval-based-dialogue-system- on-ubuntu-corpus/18/output:model_dir 'python udc_test.py --model_dir=?'

中放什么

相应地,我认为我必须调整测试文件中的一些行:

--model_dir=?

......以及列车档案(虽然不确定......):

tf.flags.DEFINE_string("test_file", "/tut_test/test.tfrecords", "Path of   
test data in TFRecords format")
tf.flags.DEFINE_string("model_dir", "/model_dir", "Directory to load model    
checkpoints from")

当我使用例如tf.flags.DEFINE_string("input_dir", "/tut_train", "Directory containing input data files 'train.tfrecords' and 'validation.tfrecords'") tf.flags.DEFINE_string("model_dir", "/model_dir", "Directory to store model checkpoints (defaults to /model_dir)") 以及上述调整的代码,我收到此错误:

--model_dir=/model_dir

这并不令人惊讶。

有人可以给我一些关于如何将训练输出提供给测试运行的说明吗?

我也会在Floydhub论坛上发布这个问题。

谢谢!

1 个答案:

答案 0 :(得分:2)

您可以像挂载数据一样挂载任何作业的输出。在您的示例中:

--data janinanu/projects/retrieval-based-dialogue-system- on-ubuntu-corpus/18/output:model_dir

应该将整个输出目录从第18行安装到新作业的/mount_dir

您可以通过查看作业页面来确认这一点(选择"数据"选项卡以查看在哪些路径上安装了哪些数据集)。

在您的情况下,您能否确认测试是否正在寻找正确的模型文件名?

我也会在FloydHub论坛上回复此事。