我一直关注this链接以使用textum。我使用提供的命令训练了模型。但我没有看到任何文件夹' train' in' textsum / log_root /'目录。由于对样本文件进行了培训,模型是否能够处理实时测试数据?如果没有,我如何制作培训数据并培训模型?最重要的是,我如何测试/使用模型来查看结果汇总?
答案 0 :(得分:2)
老实说,如果你已经正确地传递了所有参数,我不能回答为什么你不会在log_root目录中看到一个train文件夹。另外需要注意的是确保等待足够长的时间。因此,当您使用Textsum执行训练运行时,您是否看到任何详细日志表明存在一些错误,例如没有文件列表或其他内容。如果是这样,那么你的路径被传递给其中一个参数可能是关闭的。它也与您调用它的路径有关,因此您需要确保您位于工作区文件所在的根路径。
另一件事,你使用的是CPU还是GPU?如果您正在使用CPU ......模型需要一段时间才能达到甚至能够写出数据的程度。现在,如果您使用的是GPU,那么速度要快得多,但您需要等到看到“average_loss”日志开始打印到屏幕上。一旦你注意到这些,那么很有可能你会看到带有数据的“train”文件夹。
至于“实时”测试数据,我现在仍然在研究这个问题,现在我已经在模型中训练了我当前的数据,我也将开始这样做。到目前为止,我理解的方向是,一旦你训练了你的模型并获得你的泡菜文件或其他任何东西,你就可以使用这里的信息“服务”它:https://tensorflow.github.io/serving/
此时您的模型已经过培训,您可以对其进行查询并提供新的响应,以便随着时间的推移您的模型变得更加智能。我再次用一个例子来证明这一点,但这是我即将在这里开始的方法。
关于“测试模型”,您几乎可以按照textum git上提供的说明,重新生成词汇文件,然后进行培训。然后,在将平均损失降到足够小的分数之后,您可以对数据进行解码。然后在log_root decode文件夹中,您将看到生成的标题及其相关的参考文件(实际标题是什么)。希望这有帮助,祝你好运!