prediction - 情感分析Google Prediction API

时间：2014-01-13 12:41:12

标签： prediction google-prediction

我正在阅读Google Prediction API，但无法找出部分文档。

从use cases开始，我对此部分有所了解：

每行只能分配一个标签，但您可以应用多个通过重复一个例子并应用不同来标记一个例子每个标签。例如：“兴奋”，“天哪！真是太棒了一天！“”讨厌“，”天啊！刚刚度过了美好的一天！“如果你发了一条推文对于这个模型，你可能得到这样的分类： “兴奋”：0.6，“烦人”：0.2。

为什么它会“激动”：0.6，“烦人”：0.2而激动时没有更多功能。为什么兴奋兴奋？

答案 0 :(得分：2)

并不是标签“兴奋”是首选，而是消息实际上应被归类为“兴奋”而不是“恼火”的概率。

假设我有两种情绪分类：“看涨”和“看跌”。然后，我使用偶数量的“看涨”和“看跌”训练数据在Prediction API中训练模型。当我向Prediction API提交消息以获得情绪时，它会读取文本并根据消息中的单词分配“看涨”和“看跌”概率的概率。概率之和将加起来为1.

同样，并不是一个标签比另一个标签更受欢迎，但消息被“兴奋”的可能性是“恼火”的3倍。

答案 1 :(得分：1)

如果你用这两个例子训练模型，“兴奋”和“烦人”标签的句子“OMG！只是度过了美好的一天！”，查询分类的唯一合理结果就像这样的“OMG！刚刚度过了美好的一天！“应该“兴奋”：0.5，“烦人”：0.5。

因此，Google文档中的情况可能并未得到完美解释。我猜他们更专注于试图解释可以将2个不同的标签与完全相同的句子相关联。