我现在正在开展一个项目,包括对句子的情绪分析。 我得到了本教程的帮助: https://github.com/rvinas/sentiment_analysis_tensorflow
在这个模型中,我使用的CSV文件包含标记为正面或负面的推文句子。 我几乎没有问题:
1.如果我使用word2vec算法,例如' skip-gram'模型,然后将嵌入层送入此网络?或者它与初始化随机矩阵相同,让网络在训练过程中自己学习单词?
2.如果我使用大型数据集,我可以如何改进模型?让我们说我正在使用100,000个样本..什么是隐藏层/批/训练步骤参数可以提供最佳性能?我知道没有基本规则,但我想知道如果有某些限制,我必须考虑。
3.如何使用Tensorflow投影仪绘制正/负分类结果?我创建了一个'metadata.tsv'它由我的词典中的单词组成,但我希望有可能为正面和负面分类着色
答案 0 :(得分:0)
我无法回答第3点。但是第1点,是的,有很多不同之处,我会建议你传递嵌入向量,因为网络可以在语义上下文中学习超参数。第2点建议您通过搜索word2vec和lstm来查看Google学者的现有研究。我相信在这方面已经完成了研究。