一百万个类别的热编码

时间:2018-11-13 20:44:01

标签: python keras neural-network one-hot-encoding language-model

对于语言模型,我必须根据给定的单词序列预测一个单词。我的词汇包含一百万个单词。我正在尝试从中预测单词。我尝试对预测词使用一种使用keras(to_categorical)的热编码。但是对于这么大的词汇量,我在python中遇到内存错误。有什么办法可以克服这个问题,否则我的方法是错误的?

0 个答案:

没有答案