应用错误收集

keras lstm中的巨大内存负载（时间步长x功能）

时间：2017-12-21 23:01:06

标签： python deep-learning keras lstm sentiment-analysis

有10000个文件由200000个单词组成（每个单词）。我把所有文件中的所有单词放在python列表中。 np.reshape 是（10000,200000,256）。 256是因为一个热编码。这种方法的主要问题是内存，因为 input_shape =（200000,256）。我不知道是否可以进行反演，例如 np.reshape （10000,256,200000）和 input_shape =（256,200000），因为一切都是相同的如果keras正确地拆分每个样本，或者每个文件的单词都是用其他文件中的单词混合，最后返回错误的分类，我就没有确定。

1 个答案:

答案 0 :(得分：0)

词干，

找到独特的单词，

删除停用词，

阅读本教程;

https://machinelearningmastery.com/clean-text-machine-learning-python/

keras nb_samples，timesteps，input_dim
LSTM：了解时间步长，样本和功能，特别是在reshape和input_shape中的使用
对于Keras LSTM，传递滞后特征与特征时间步长的区别是什么？
keras lstm中的巨大内存负载（时间步长x功能）
展开，时间步长，批量大小和隐藏单位
Keras RNN输入时间步顺序
keras将2d张量转换为3d偏移的时间步长
Keras遮罩层，用于LSTM输入以遮罩要素而不是时间步
在循环时间步长期间记录LSTM内部门激活
对串联层使用不同的时间步长

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？