如果数据包含相似(重复)文本,如何将其作为Keras的输入?

时间:2019-06-20 18:23:43

标签: python text keras theano

我已经用现有的文本数据构建了Keras模型。现在,当我获得更多数据以添加有效更新我的先前模型时需要执行哪些步骤。我主要担心的是,如果我随机开始添加数据而没有预测该类,那么如果新数据包含重复的文本,则会创建类似的类,这可能会导致模型的准确性下降。

以前,我一直在考虑是否有任何方法可以同时进行测试和培训,这样我就可以避免添加重复数据,但找不到解决方案。

0 个答案:

没有答案