我正在开发一个C ++ Twitter公司情绪分析工具。用户输入公司,该工具分析一组推文并返回情绪。
到目前为止,我做了以下事情:
然后我将推文解析为单词,并检查两个词的正面和负面词汇。我为每条推文创建了一个完整的情绪。然后我计算正面,中性和负面推文的数量,以得出最终答案。没有使用重量。
我正在考虑实施以下两件事:
然而,即便如此,大多数搜索最终都是非常中立的。例如,如果我在100条推文中搜索“Apple”,我会说30个正数,10个负数和60个中性。
问题:
1.有没有办法降低中立数?
2.我应该添加什么样的正面和负面词来代表我的搜索标准(公司)
答案 0 :(得分:1)
你说没有使用加权,但为什么不添加它。为每个+/-字分配1的基本权重,然后可以应用以下某些条件: