分离培训和标记代码的一部分

时间:2014-04-01 16:16:39

标签: java sections training-data

我如何拥有一个带有两个独立可执行部分的应用程序(代码)。第一个训练标记器(提供标记器的统计信息),第二个使用第一个的数据标记句子的单词。由于训练部分总是很耗时(1-2分钟),我想保留结果,并在标记器中分别使用它们几次(测试代码),而不必每次都运行第一部分。

您对此有任何建议或解决方案吗?

1 个答案:

答案 0 :(得分:0)

我不确定你在这里尝试做什么。但总的来说,你不应该做这样复杂的事情。我假设您正在训练某种神经网络或类似的东西吗?

如果您担心的是每次都不想运行培训师,那么在完成培训后,您只需将经过培训的网络(或您正在使用的任何数据结构)保存到磁盘即可。然后,当您启动程序时,您的代码可以检查磁盘上是否存在已经过训练的网络。如果是这样,它可以加载它然后针对它运行标记器。如果没有,它将首先训练网络,将其保存到磁盘,然后运行它。