我正在(尝试)用Keras和Python编写一个神经网络,以从760k字符技术pdf中随机抽取100个字符,并使用LSTM网络预测接下来的50个字符。
到目前为止,我已经编写了代码来对文本进行一键编码。有98个唯一字符(有几个希腊字母等),所以我希望一种热门编码的文本看起来像这样:
.nuspec
这就是我的打印报表显示的内容。如果需要,我可以将执行此操作的代码放在此处。然后,我的程序选择每100个热编码字符集添加到列表[0, 0, 1, 0 ... 0, 0, 0]
[0, 0, 0, 1 ... 0, 0, 0]
[0, 0, 0, 0 ... 0, 0, 0]
.
.
.
[0, 0, 0, 0 ... 0, 1, 0]
中,然后选择每1个热编码字符集添加到列表x
中。这将创建3d输入列表。
当将该python列表移植到我的模型的numpy列表中时,出现了我的麻烦。无论我如何尝试用y
重塑列表,我总是会得到一个错误:x = asarray(x).reshape
。对我来说,这意味着我没有正确的尺寸x,y和z值,有些乘法证明了这一点。但是我只是不知道什么是正确的值。正确的值是什么?
这似乎是一个基本问题,但是我对ML尤其是LSTM基本上一无所知。那么,我所缺少的希望很小而又简单的东西是什么?
感谢您提供的任何帮助。