我有一个数据集,其中包含四个带有情感标签的推文(愤怒,喜悦,恐惧,悲伤)。例如,我将推文转换为类似于以下愤怒输入向量的向量:
愤怒代币的频率分布平均值
word2vec
与愤怒相似情感词典中的愤怒手段
主题词词典中的愤怒手段
该向量对训练神经网络有效吗?
答案 0 :(得分:3)
您的输入向量看起来很好。当然,您以后可能会使用来自twitter或其他相关API或数据集的统计数据和派生数据使它更加先进。
您的网络有四个输出,就像您提到的那样:
Joy: [1,0,0,0]
Sadness: [0,1,0,0]
Fear: [0,0,1,0]
Anger: [0,0,0,1]
如果愿意,您可以考虑添加多个隐藏层并使之成为一个深层网络,以提高神经网络原型的稳定性。
正如您的问题也显示的那样,最好在训练和测试数据之前拥有一个良好的预处理器和特征提取系统,这似乎是您知道的,项目将要进行下去。
伟大的项目,最良好的祝愿,感谢您提出的好问题,欢迎访问stackoverflow.com!