标签: keras deep-learning autoencoder word-embedding unsupervised-learning
我的文字描述很长,希望对其进行压缩和总结以供进一步研究。我了解了自动编码器及其在对数据进行去噪和降低维数方面的效率。我的问题是,如果要构建自动编码器,应该首先在文本和摘要上对其进行训练,还是可以找到像Word2Vec模型这样的表示形式。对我来说,自动编码器的培训要点还不是很清楚。
我以前已经使用过Word2Vec和Doc2vec词嵌入模型,现在想用自动编码器对其进行测试
由于可以在无监督的情况下训练自动编码器,所以我希望传递所有数据集,并且自动编码器可以找到最佳表示形式。
谢谢