如何为LSTM训练拆分文本数据

时间:2020-11-10 04:18:35

标签: python tensorflow keras lstm

我正在使用可提供多达35 GB内存的Colab Pro TPU。我的数据集包含650,000个序列。我正在尝试使用BiDirectional LSTM预测下一个单词。

当我尝试使用to_categorical()生成binary_class向量时,由于内存限制,它崩溃了。我采用了前200k序列,对模型进行了训练,准确性几乎停在65%左右。在调整超参数之前,我想提供整个数据集并训练模型。是否可以拆分数据集,生成序列,将其加入训练?

赞赏任何建议。

谢谢。

0 个答案:

没有答案