保存文本索引编码映射

时间:2017-05-19 14:32:16

标签: tensorflow keras

所以我能够用Keras训练一个文本分类器,我也可以保存模型。我的问题是,当我加载模型来预测未知文本时,我必须对输入文本进行编码,就像在训练过程中编码一样。如何在训练部分保存映射并在进行预测时重新加载?

这是我用于将单词映射到训练中的索引的代码。我使用tensorflow的VocabularyProcessor。

processor = learn.preprocessing.VocabularyProcessor(1000)
x = np.array(list(processor.fit_transform(x_raw)))
y = np.array(y_raw)

非常感谢!

1 个答案:

答案 0 :(得分:0)

想通了:

processor.save(...)

learn.preprocessing.VocabularyProcessor.restore(...)