与音乐相关的Twitter数据的情绪分析功能

时间:2016-11-13 02:00:26

标签: apache-spark twitter nlp classification sentiment-analysis

需要一些与关于音乐相关的推文的情绪分析相关的指导。

我试图对与音乐相关的推文进行Twitter数据的情绪分析。经过大量的网络搜索,我已经了解了如何使用' tweepy'来获取推文。 python api也意识到我可以使用Naive Bayes分类器'最后对推文进行分类。现在我对如何定义此分类的功能感到困惑,我应该定义至少500个功能。所以这是我的问题。我不想使用任何已经可用的API,例如' textblob'找到推文的情绪。

1)任何人都可以提供一些我们可以用来分类音乐相关推文的功能示例吗? [我们可以使用带有快乐笑脸的推文作为积极的训练集吗?如果这些推文中的单词为我的分类器提供了哪些功能?]

2)我们如何为这个分类器生成训练集?

3)如果我想过滤与音乐相关的推文的推文,我可以使用Bloom Filter来实现吗?

4)我可以通过tweepy api获得的数据大小是多少?

如果我的理解有问题,请纠正我。

0 个答案:

没有答案