我正在为文档打分,尤其是在财务分析数据方面。
问题在于,情绪得分通过其拥有的代币数量进行归一化。因此,我发现几乎每个绝对得分的值都低于0.1,与句子情感得分相比,这并不算什么。
我尝试仅用正值和负值计数进行归一化。但是值仍然很小。
是否有任何微积分在文档级情感分析上表现良好并且得分在-1和1之间?
我已经使用Sentiwordnet 3.0来分析文档单词的情感 https://github.com/aesuli/SentiWordNet
并使用此github代码对文档进行评分 https://github.com/anelachan/sentimentanalysis