标签: python tensorflow keras lstm
我正在使用可提供多达35 GB内存的Colab Pro TPU。我的数据集包含650,000个序列。我正在尝试使用BiDirectional LSTM预测下一个单词。
当我尝试使用to_categorical()生成binary_class向量时,由于内存限制,它崩溃了。我采用了前200k序列,对模型进行了训练,准确性几乎停在65%左右。在调整超参数之前,我想提供整个数据集并训练模型。是否可以拆分数据集,生成序列,将其加入训练?
赞赏任何建议。
谢谢。