过滤推特数据

时间:2015-06-02 13:48:19

标签: twitter nlp nltk sentiment-analysis

我已经实施了一种无监督算法,用于对来自社交媒体网站,特别是Twitter的数据进行情绪分析 但是,我打算衡量一下人们对特定主题的看法,例如“某些州的交通” 我可以使用“流量”,“拥堵”,“行人”等关键词来收集数据 这些获得的数据中的一些具有不同的背景并且与交通无关。

我的问题是 -

1.如何根据主题过滤数据?
2.我是否需要执行主题提取或使用垃圾邮件过滤器?

1 个答案:

答案 0 :(得分:0)

this之类的内容会有帮助吗?他们提供了一个基于上下文分析Twitter情绪的API。虽然,您可能仍会遇到与垃圾邮件相同的问题。

(对不起,这可能不是一个答案,但我无法发表评论)。