我有一个大小为1000的文档集,它们都有1个特征,一个包含5个元素的向量。 5个元素的总和等于100.所以例如我可以有一个特征文件:[10,15,40,20,15]。
每个向量元素等于情绪,从非常负面到非常正面。 我得到的1000个文本文档的结果在消极方面有点出现, 所以我试图在不改变总和的情况下向右推动它们。
例如[10,15,40,20,15]应用公式后,应该得到[7,13,32,40,8]。 我该如何管理?
提前致谢!
答案 0 :(得分:1)
据我所知,你希望那个矢量的第一个(左)元素变小,而右边的元素变大,对吗?这可以通过向每个向量添加类似[-10,-5,0,5,10]的内容来实现。
答案 1 :(得分:0)
如果问题是语料库确实比你想要的更负面,那么在分析之前如何预先分配每个文档:
I am a happy bunny!
如果这还不够,那么还要加入:
The sun is shining beautifully in Happy Bunny Land today!!
如果问题在于您的分析产生的结果比您认为的正确答案更负面,那么请调整权重(如果使用加权方法);如果不使用加权单词方法,并且您有正面和负面单词列表,则查看文档上下文的列表,并删除一些否定单词,或者在正面列表中添加更多单词。