我一直在研究使用RNN生成文本,似乎常见的技术是逐字符输入文本,并让RNN预测下一个字符。
为什么你不会使用相同的技术,而是使用单词而不是字符。 这对我来说似乎是一种更好的技术,因为RNN不会进行任何拼写错误,而且训练速度会更快。
我错过了什么吗?
此外,是否可以创建单词预测RNN,但以某种方式输入在word2vec上预训练的单词,以便RNN能够理解它们的含义?
答案 0 :(得分:4)
为什么不使用相同的技术,而是使用单词而不是字符。
基于字的模型的使用频率与基于字符的模型一样频繁。请参阅this question中的示例。但两者之间存在一些重要的差异:
顺便说一下,还有一些中间的子词模型。请参阅T. Mikolov撰写的"Subword language modeling with neural networks"
此外,是否可以创建一个单词预测RNN,但以某种方式输入在word2vec上预先训练的单词,以便RNN可以理解它们的含义?
是的,我上面提到的example正好与这种模型有关。