Twitter Sentiments Analysis有用的功能

时间:2011-11-30 07:43:49

标签: nlp text-processing classification sentiment-analysis

我正在尝试实现Sentiments Analysis功能并寻找可以从推文消息中提取的有用功能。我现在想到的功能是:

  1. 情感词
  2. 情感图标
  3. 感叹号
  4. 否定词
  5. 强度词(非常,非常等)
  6. 此任务还有其他有用的功能吗? 我的目标不仅是检测推文是正面的还是负面的,而且还需要检测积极性或消极性的水平(比如从0到100的比例)。 任何对印刷纸张的输入或参考都是非常受欢迎的。

    感谢。

3 个答案:

答案 0 :(得分:3)

其他可能有用的是:

  • 细长的词汇(例如goooood)
  • 每个单词的unigrams和bigrams(特别是如果你有一个大的语料库)

关于参考: 克里斯托弗波茨的这个教程非常好,并且重点:http://sentiment.christopherpotts.net/

其他文件:

  • 推特作为情感分析和意见挖掘的语料库。 Alexander Pak,Patrick Paroubek
  • 使用远程监督的Twitter情感分类。 Go等人。 2009年。
  • 来自偏见和嘈杂数据的Twitter上强大的情绪检测。巴博萨和冯。 2010。
  • 简短的非正式文本中的情绪强度检测。 Thelwall等人。 (2010年)。 JAIST

答案 1 :(得分:2)

如果我在Twitter上发布真正的好消息,很多人可能会公开祝贺我 所以如果我发布X,然后从其他人那里得到很多'恭喜'的推文,那么X可能是正面的。
一般来说,转推我的推文的人的类型和频率可能与其固有的情绪有关。

答案 2 :(得分:1)

我会建议以下文章: