将一个热编码样本输入到LSTM网络?

时间:2019-06-04 03:50:46

标签: python tensorflow keras lstm

我正在(尝试)用Keras和Python编写一个神经网络,以从760k字符技术pdf中随机抽取100个字符,并使用LSTM网络预测接下来的50个字符。

到目前为止,我已经编写了代码来对文本进行一键编码。有98个唯一字符(有几个希腊字母等),所以我希望一种热门编码的文本看起来像这样:

.nuspec

这就是我的打印报表显示的内容。如果需要,我可以将执行此操作的代码放在此处。然后,我的程序选择每100个热编码字符集添加到列表[0, 0, 1, 0 ... 0, 0, 0] [0, 0, 0, 1 ... 0, 0, 0] [0, 0, 0, 0 ... 0, 0, 0] . . . [0, 0, 0, 0 ... 0, 1, 0] 中,然后选择每1个热编码字符集添加到列表x中。这将创建3d输入列表。

当将该python列表移植到我的模型的numpy列表中时,出现了我的麻烦。无论我如何尝试用y重塑列表,我总是会得到一个错误:x = asarray(x).reshape。对我来说,这意味着我没有正确的尺寸x,y和z值,有些乘法证明了这一点。但是我只是不知道什么是正确的值。正确的值是什么?

这似乎是一个基本问题,但是我对ML尤其是LSTM基本上一无所知。那么,我所缺少的希望很小而又简单的东西是什么?

感谢您提供的任何帮助。

0 个答案:

没有答案