去语言情感分析

时间:2016-02-26 15:47:36

标签: math go machine-learning sentiment-analysis

我正在使用以下库对我的Feed上的Facebook帖子进行一些情绪分析,作为一个有趣的实验:https://github.com/cdipaolo/sentiment

但我遇到的问题是从model.SentimentAnalysis()调用返回的Analysis对象没有加权分数。它为句子返回的得分值是0或1.这使得它的定义过于模糊,我希望每个Facebook帖子都有一个情绪量表,所以从0到1.0的浮点数是理想的,其中1是100%为正,0为100%为负。

有没有办法可以利用对象中的Words变量(在这个文件中,你可以在底部https://github.com/cdipaolo/sentiment/blob/master/model.go下看到它)来循环句子中的每个单词分数,以创建我自己的加权情绪得分了?例如,positive_words / total_words会起作用吗?这会给我一个数字来表示该帖子的正面情绪百分比,但随后加权问题又重新出现,因为这些单词也没有加权,所以例如说我得到了0.75的分数,实际上真正的分数可能会少得多,因为单词可能只略高于正阈值,但我不知道,因为它只是0表示负数或1表示正数,它不是加权浮点值。

所以我的问题是,在数学上是否有某种方法可以根据提供的数据创建自己的体重评分,或者我没有足够的数据来做到这一点?

0 个答案:

没有答案