情感分析Google Prediction API

时间:2014-01-13 12:41:12

标签: prediction google-prediction

我正在阅读Google Prediction API,但无法找出部分文档。

use cases开始,我对此部分有所了解:

  

每行只能分配一个标签,但您可以应用多个   通过重复一个例子并应用不同来标记一个例子   每个标签。例如:“兴奋”,“天哪!真是太棒了   一天!“”讨厌“,”天啊!刚刚度过了美好的一天!“如果你发了一条推文   对于这个模型,你可能得到这样的分类:   “兴奋”:0.6,“烦人”:0.2。

为什么它会“激动”:0.6,“烦人”:0.2而激动时没有更多功能。为什么兴奋兴奋?

2 个答案:

答案 0 :(得分:2)

并不是标签“兴奋”是首选,而是消息实际上应被归类为“兴奋”而不是“恼火”的概率。

假设我有两种情绪分类:“看涨”和“看跌”。然后,我使用偶数量的“看涨”和“看跌”训练数据在Prediction API中训练模型。当我向Prediction API提交消息以获得情绪时,它会读取文本并根据消息中的单词分配“看涨”和“看跌”概率的概率。概率之和将加起来为1.

同样,并不是一个标签比另一个标签更受欢迎,但消息被“兴奋”的可能性是“恼火”的3倍。

答案 1 :(得分:1)

如果你用这两个例子训练模型,“兴奋”和“烦人”标签的句子“OMG!只是度过了美好的一天!”,查询分类的唯一合理结果就像这样的“OMG!刚刚度过了美好的一天!“应该“兴奋”:0.5,“烦人”:0.5。

因此,Google文档中的情况可能并未得到完美解释。我猜他们更专注于试图解释可以将2个不同的标签与完全相同的句子相关联。