我已经实施了一种无监督算法,用于对来自社交媒体网站,特别是Twitter的数据进行情绪分析
但是,我打算衡量一下人们对特定主题的看法,例如“某些州的交通”
我可以使用“流量”,“拥堵”,“行人”等关键词来收集数据
这些获得的数据中的一些具有不同的背景并且与交通无关。
我的问题是 -
1.如何根据主题过滤数据?
2.我是否需要执行主题提取或使用垃圾邮件过滤器?
答案 0 :(得分:0)
this之类的内容会有帮助吗?他们提供了一个基于上下文分析Twitter情绪的API。虽然,您可能仍会遇到与垃圾邮件相同的问题。
(对不起,这可能不是一个答案,但我无法发表评论)。